第三章概率分布与抽样分布中国工业大学

上传人:小** 文档编号:45552611 上传时间:2018-06-17 格式:PPT 页数:46 大小:918.52KB
返回 下载 相关 举报
第三章概率分布与抽样分布中国工业大学_第1页
第1页 / 共46页
第三章概率分布与抽样分布中国工业大学_第2页
第2页 / 共46页
第三章概率分布与抽样分布中国工业大学_第3页
第3页 / 共46页
第三章概率分布与抽样分布中国工业大学_第4页
第4页 / 共46页
第三章概率分布与抽样分布中国工业大学_第5页
第5页 / 共46页
点击查看更多>>
资源描述

《第三章概率分布与抽样分布中国工业大学》由会员分享,可在线阅读,更多相关《第三章概率分布与抽样分布中国工业大学(46页珍藏版)》请在金锄头文库上搜索。

1、第三章 概率分布与抽样分布(Distribution and Sample Distribution)一、概率与概率分布(一)概率通俗地说,概率就是机率。在相同条件下进行n次随 机试验,事件A出现m次,则比值m/n称为事件A发生的频 率。随着n的增大,该频率围绕某一常数P上下摆动,且 波动的幅度逐渐减小,趋向于稳定,这个频率的稳定值 即为事件A的概率,记为P(A)=m/n。条件概率:A、B为两个随机事件,P(AB)称为事 件B发生的前提下事件A发生的条件概率。P(AB)= ,P(B)0。由于增加了新的条件(附加信息),一般说来,P( AB)P(A)。乘法公式:将条件概率公式变形可得:P(AB)

2、=P(B)P(AB)将上式中A、B的位置对调,可得:P(AB)=P(A)P(BA)以上两式统称概率乘法公式。全概率公式与逆概率公式:1、完备事件组若事件A1、A2、An互不相容(互斥),且其中之一 必然发生,则事件A1、A2、An组成完备事件组。即A1A2An=, AiAj=(ij)2、全概率公式若事件A1、A2、An为完备事件组,则对任一事件B ,有一、概率与概率分布(二)概率分布概率与随机变量密不可分。随机变量:离散型、连续型。概率分布:随机变量取一切可能值的概率的规律称 为概率分布,即P(x=everyprobnumber)=?概率分布可以用表、图形或公式等多种方式来表示 。二项分布:只

3、有两种可能结果的试验称为贝努利试验。n次独立 重复的贝努利试验称为n重贝努利试验。在n重贝努利试 验中,结果A(成功)出现m次的概率分布为:其中: 几何分布:在可列重贝努利试验中,结果A(成功)在第m次首 次出现的概率分布为:二项分布、几何分布都是贝努利试验导出的分布。超几何分布:二项分布与几何分布都是在n重或可列重相互独立的 贝努利试验中形成的。那么,如果这种试验不是相互独 立的呢?比如:假定有一批500个产品,而其中有5个次品。假定该 产品的质量检查采取随机抽取20个产品进行检查。如果 抽到的20个产品中含有2个或更多不合格产品,则整个 500个产品将会被退回。这时,人们想知道该批产品被退

4、回的概率是多少。 该概率满足超几何分布(hypergeometric distribution) 。这样的抽样一般采取“不放回抽样”,也就是说, 每次抽取之后并不放回。在这种情况下,每次抽取之后 ,总体之中的合格和不合格品的比例都会发生变化,和 以前不一样了,因此,每次试验不再是独立的贝努利试 验,在n次试验中,结果A(成功)出现m次的概率分布也 就不再服从二项分布,而是服从超几何分布:其中N为产品总数,n为试验次数也即抽取出的产品 数;K为产品中结果A的总数也即产品中的总次品数。一、概率与概率分布(三)概率密度函数与累积概率分布函数连续型随机变量不好讲概率分布,所以讲累积概率 分布,P(x=

5、30的条件,样本均值也近似服从正态分布,即:同理,对于两个相互独立的正态总体N(1,12)、N(2,22),假设我们从这两个总体中分别抽取一个n1、n2个观察值组成的样本,那么,这两个样本均值的差也服从正态分布,即:思考:如果这两个总体不是正态总体而n1、n2足够大,样本均值差的分布形态还是这样的吗?标准正态分布N(0,1):标准正态分布的重要性在于,任何一个一般的正态分布都可以化为标准正态分布,即 N(0,1)。所以,说一个随机变量服从正态分布,与说它服从标准正态分布没什么太大差别,因为它可以转化为标准正态分布。数据的标准得分:我年收入60万,多吗?两个水平类似的班级(一班和二班)上同一门课

6、,但是由于两个任课老师的评分标准不同,使得两个班成绩的均值和标准差都不一样(数据:grade.txt)。一班的平均分和标准差分别为78.53和9.43,二班的均值和标准差分别为70.19和7.00。那么,一班得90分的张颖是不是比二班得82分的刘疏成绩更好呢?怎么比较才更合理呢?数据的标准化:虽然均值和标准差不同的数据不好直接比较,但是可以把它们进行标准化,再比较标准化后的数据。数据标准化的方法主要有两种;数据标准化后得到的值称为标准得分(standard score、z-score):可以看出,原始数据在各自的均值附近,离散程度 也不一样。但它们的标准得分则在0周围,且离散程度也 差不多。数

7、据经过标准化后,均变换成均值为0、方差为 1的样本。标准化后的数据没有量纲;不同样本观测值的 比较只有相对意义,没有绝对意义。10097N =?1101009080706050402110097N =?3210-1-2-3-421三、 分布若X1、X2、Xn相互独立,且均服从标准正态分布N(0,1)。则随机变量Y=X12+X22+Xn2的概率分布为自由度为n的 分布,简记为Y (n)。自由度:变量的自由程度。对于样本方差S2,则:比如,有些产品出厂时不仅需要标注其性能参数均 值,而且要标明均值的方差(标准差)。为了估计某产 品能耗的方差,我们随机抽取了10件,测得其能耗为( 千瓦时/小时):1

8、2.5,12.12,12.01,12.28,12.09, 12.03,12.01,12.11,12.06,12.14。那么,当其能耗x服从正态分布时:思考:在上一张片子中,下面的统计量是严格服从卡方分 布还是近似服从卡方分布?为什么?再比如,为研究家庭食品支出与收入的关系,随机 抽取了10户家庭作为样本,得到如下数据:那么,当食品支出y服从正态分布时:下表是工商07级1班、2班某门课的考试成绩。思考: 服从卡方分布吗?如果服从,其自由度是多少?如果不服从,那在什么情况或什么条件下服从?四、t分布若随机变量XZ(0,1),Y (n),且X、Y相互独立,则随机变量Z= 服从自由度为n的t分布,简记

9、为Zt(n)。t分布概率密度曲线图如下:特点:1、t分布为对称分布;2、n充分大时,t分布 近似Z(0,1)。 考察统计量其中,分子 ,分母中 。因此,Tt(n-1)。五、F分布若随机变量X (n1),Y (n2),且X、Y相互独立,则随机变量Z= 服从自由度为(n1,n2)的F分布,简记为ZF(n1,n2)。F分布的概率密度曲线如下: 比如,下表是工商07级1班、2班某门课的考试成绩 。假设两个班的学生成绩相互独立且都服从正态分布, 那么,要分析两个班学习成绩的分化程度,我们可以考 察下面的统计量:比如,下表是工商07级1班、2班某门课的考试成绩 。假设两个班的学生成绩相互独立且都服从正态分

10、布, 那么,要分析两个班学习成绩的分化程度,我们可以考 察下面的统计量:六、随机变量X与Y相互独立的充要条件:1、离散变量:P(X=xi,Y=yi)= P(X=xi)P(Y=yi)(边缘概率分布之积等于联合概率分布)2、连续变量:f(x,y)=fX(x)fY(y)(边缘概率密度之积等于联合概率密度)R软件中的统计计算:常用分布:norm:正态;t:t分布;f:F分布;chisq:卡方分布;unif:均匀分布;binom:二项分布。每种分布有四个函数:ddensity(密度函数);pprobability(概率分布函 数);qquantile(分位数函数);rrandom(随机数函数)。如,对于

11、正态分布来说:dnorm、pnorm、qnorm、rnorm。 pnorm(0,0,1); rnorm(100,0,1); qnorm(0.975,0,1)#画正态分布概率密度曲线(N(0,1),N(0,22),N(0,32) x=seq(-6,6,length=2000) plot(x,dnorm(x,0,1),type=“l“,lwd=3,xaxs=“i“,yaxs=“i“,font=3,ylab=“Dens ity of Normal“, main=“正态分布概率密度曲线(=0)“,col=“red“, pch=4) points(x,dnorm(x,0,2),type=“l“,lwd=

12、3,col=“red“) #增加N(0,22)概率密 度曲线 points(x,dnorm(x,0,3),type=“l“,lwd=3,col=“red“) #增加N(0,32)概率密 度曲线 #以下两句主要是把-1左边的区域加上竖线 x1=seq(-6,-1,length=30) points(x1,dnorm(x1,0,1),type=“h“,lwd=2,col=“dark green“) #把-1左边区域 加上竖线 text(-1,0.01,labels=“if Xz(0,1),p(Xtext(locator(1),“=1“,adj=0);text(locator(1),“=2“,adj=0);text(locat or(1),“=3“,adj=0) #通过鼠标直接点击给图形加上文字

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 经营企划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号