第2章 理论分布与抽样分布精编版

上传人:ahu****ng1 文档编号:143780570 上传时间:2020-09-02 格式:PPTX 页数:71 大小:745.73KB
返回 下载 相关 举报
第2章 理论分布与抽样分布精编版_第1页
第1页 / 共71页
第2章 理论分布与抽样分布精编版_第2页
第2页 / 共71页
第2章 理论分布与抽样分布精编版_第3页
第3页 / 共71页
第2章 理论分布与抽样分布精编版_第4页
第4页 / 共71页
第2章 理论分布与抽样分布精编版_第5页
第5页 / 共71页
点击查看更多>>
资源描述

《第2章 理论分布与抽样分布精编版》由会员分享,可在线阅读,更多相关《第2章 理论分布与抽样分布精编版(71页珍藏版)》请在金锄头文库上搜索。

1、,第二章 理论分布与抽样分布,第一节 理论分布 一、正态分布的定义 正态分布或称高斯(Gauss)分布,是一种常见的连续型随机变量的概率分布。 食品科学中所涉及的许多变量都是服从或接近正态分布的。,正态分布 概率密度函数:,x : 所研究的变数; :x的函数值,称为概率密度函数; :总体平均数; :总体标准差,其中, 2是两个常数,正态分布记为N( , ) ,表示具有平均数为,方差为 的正态分布。,2、f(x)在 处达到最大值,且,3、 f(x)是非负函数,以横轴为渐进线,分布从- 到+ ,且曲线在 处各有一个拐点。,二、正态分布曲线的特征:,1、正态分布曲线是以平均数为中心左右对称分布的单峰

2、悬钟形曲线,在平均数的左右两侧,只要(x-)的绝对值相等,f(x)值就相等。,4、正态分布曲线是以参数 和2的不同而表现的一系列曲线,所以正态分布曲线是一个曲线族,不是一条曲线。,5、正态分布的次数多数集中于算术平均数的附近,离平均数愈远,相应的次数愈少,在-3 以外次数极少。,6、曲线 f(x)与横轴之间所围成的面积等于1 ,即,正态分布的分布函数F(x)为:,二、标准正态分布,由于正态分布是依赖于参数和2 的一簇分布,正态曲线的位置由于上述参数的变化而不同。因此,在研究具体的正态分布时,需要将一般的正态分布标准化,转换成为0,2 1的正态分布,我们称0,2 1的正态分布为标准正态分布(st

3、andard normal distribution),记作: N(0,1)。,标准正态分布的概率密度函数记为 (u):,标准正态分布的概率分布函数记为 (u):,对称随机变量u服从标准正态分布,记作uN(0,1),其密度曲线如图。,任何一个服从正态分布N(,2)的随机变量x都可以通过标准化变换,将其转化为服从标准正态分布的随机变量u,u称为标准正态离差或标准正态变量(standard normal deviate)。,按标准正态分布的分布函数公式计算,对不同的u值编成函数表,称为标准正态分布表(附表1),从中可以查到任意一个区间内曲线下的面积概率值。,三、正态分布的概率计算,根据正态分布的性

4、质,变量在两个定值间取值的概率等于曲线与其x轴在该区间围成的面积。 因此概率的计算即正态分布概率密度函数的定积分计算。 是一个曲线系统。为了一般化的应用,需将正态分布标准化。,1.标准正态分布的概率计算,设u服从标准正态分布,则u1,u2)内取值的概率为:,(u1)和(u2)可由附表1查得。,由上述公式及正态分布的对称性可推出下列关系式,再借助附表1便能方便地计算有关概率:,例1,已知uN(0,1),试求:P(u-1.64)=?,P(u 2.58)=?,P(u2.56)=?,P(0.34 U1.53)=?,利用公式,查附表1得: P(u-1.64)0.5050 P(u2.58)= (-2.58

5、)=0.004940 P(u2.56)=2 (-2.56) =20.005234=0.010468 P(0.34 u1.53 ) = (1.53)- (0.34) =0.93699-0.6331=0.30389,关于标准正态分布,以下几种概率应当熟记:,P(-1 u1)=0.6826 P(-2 u2)=0.9545 P(-3 u3)=0.9973 P(-1.96 u1.96)=0.95 P(-2.58 u2.58)=0.99,U变量在上述区间以外取值的概率分别为:,P(u1)=1-P(-1u1)=1-0.6826=0.3174 P(u2)=1-P(-2u2)=1-0.9545=0.0455 P

6、(u3)=1- P(-3u3)=1-0.9973=0.0027 P(u1.96)=1- P(-1.96u1.96) =1-0.95=0.05 P(u2.58)= 1- P(-2.58u2.58) =1-0.99=0.01,2.一般正态分布的概率计算,正态分布曲线和横轴围成的区域面积为1,表明了随机变量x在(- ,+ )之间取值,是一个必然事件,其概率为1。 若随机变量x服从正态分布N(,),则x的取值落在任意区间x1,x2)的概率,记作P(x1xx2)。,即:,对上式作变换u(x-)/ ,得dx=du,故有:,由上述证明,服从正态分布的变量x落在x1,x2)内的概率,等于服从正态分布随机变量u

7、落在 (x1 )/ , (x2- )/ )即u1,u2)的概率。 故,计算一般的正态分布的概率时,只要将区间的上、下限标准化,就可用查标准正态分布表的方法求概率值。,例:已知xN(100,22),求P(100 x102)=?,由上述证明方法可得: P(100 x102) =P(100-100)/2(x-100)/2(102-100)/2 =P(0 u1) = (1)- (0) =0.8413-0.5000=0.3413,关于一般正态分布,以下几个概念计算是经常用到的:,P(- x +)=0.6826 P(-2 x+2)=0.9545 P(-3 x+3)=0.9973 P(-1.96 x+1.9

8、6)=0.95 P(-2.58 x+2.58)=0.99,x小于26:,=(26-30)/5= -0.8,查附表1,【例如】有一随机变数X服从正态分布,平均数 =30,标准差 =5,试计算X小于26,大于40,介于26-40区间的概率。,大于40:,=(40-30)/5=2,查表1, 由正态分布左右对称性, 则,x介于26与40之间:,【例如】已知某正态分布 =30, =5 ,试计算x偏离平均数达9.8和14.9 以上的概率?,计算,标准化,查附表1,得知它们对应的概率分别为0.05和0.01,即 P(x-9.80)=P(x-1.96) =P(x-)1.96+P(x-)-1.96 =0.05

9、P(x-14.90)=P(x-2.58) =P(x-)2.58+P(x-)-2.58 =0.01 以上两式等号右侧的前一项为右尾概率,后一项为左尾概率,其和概率为两尾概率。,统计学:1、总体 样本 抽样分布 2、样本 总体 统计推断,一、样本平均数的抽样分布 复置抽样(返置抽样) 不复置抽样(不返置抽样) 抽样误差,第二节 抽样分布,总 体(,2),.,样本1,样本2,样本n,抽样误差:由同一总体进行抽样获得的多个样本平均数,与原总体平均数相比具有不同程度的差异,这种差异是由于随机抽样造成的,称为抽样误差(sampling error)。,样本平均数也是随机变量,其概率分布叫作样本平均数的抽样

10、分布。有样本平均数构成的总体称为样本平均数的抽样总体,其平均数和标准差分别计为: 是样本平均数的抽样总体的标准差,简称标准误差(standard error),统计学上已证明:样本平均数( )总体的参数 ,与x变量总体的两个参数 有如下关系:,例如,设有一个N=4的有限总体,其变量值为2、3、3、4。,总体的平均数、方差和标准差,为证明这一结论,进行模拟抽样试验,当以样本容量n=2进行独立抽样,抽取的所有可能样本数 ,其平均数、方差和标准差如下表。,样本观察值x,2 2 2 2 3 3 3 3 3 3 3 3 4 4 4 4,2,3,4,3,2,3,3,4,2,3,3,4,x,4 5 5 6

11、5 6 6 7 5 6 6 7 6 7 7 8,2,3,3,4,2.0 2.5 2.5 3.0 2.5 3.0 3.0 3.5 2.5 3.0 3.0 3.5 3.0 3.5 3.5 4.0,0.0 0.5 0.5 2.0 0.5 0.0 0.0 0.5 0.5 0.0 0.0 0.5 2.0 0.5 0.5 0.0,0.00 0.25 0.25 1.00 0.25 0.00 0.00 0.25 0.25 0.00 0.00 0.25 1.00 0.25 0.25 0.00,s,0.000 0.707 0.707 1.414 0.707 0.000 0.000 0.707 0.707 0.00

12、0 0.000 0.707 1.414 0.707 0.707 0.000,96 48 8.0 4.0 8.484,以自由度(n-1)作分母计算的样本方差 之均数:,以样本容量n作分母计算的样本方差 之均数:,样本标准差S之均数:,各样本均数总和之均数:,如果所有可能样本的某一统计数的平均数等于该总体的相应参数,则称该统计数为总体参数的无偏估计值(unbiased estimate)。,是 的无偏估计值;,是 的无偏估计值;,以n为分母得到的样本方差 不是 的 无偏估计值;,S不是 的无偏估计值;,因此,为了得到 的无偏估计值,估算样本方差时,必须以自由度df=n-1而不用n做分母。,抽样结论

13、,按上述抽样方法,再以n=4,从上述有限总体2,3,3,4中抽出全部所有样本,同样可以计算出所有样本的平均数、方差和标准差。,各种不同样本容量的样本平均数 的抽样分布,n=1,2 3 4,f,1 2 1,n=2,f,2.0 2.5 3.0 3.5 4.0,1 4 6 4 1,n=4,f,2.00 2.25 2.50 2.75 3.00 3.25 3.50 3.75 4.00,1 8 28 56 70 56 28 8 1,各种不同样本容量 的分布图,f,2 3 4,2 1 0,f,f,2 3 4,6 5 4 3 2 1 0,2 3 4,70 60 50 40 30 20 10 0,n=1;2=1

14、/2,n=2; 2=1/4,n=4; 2=1/8,从上述的表和图来看,从总体抽出的全部所有样本的平均数,当n增大时,其方柱形图逐渐趋向于正态分布曲线形状,说明样本平均数是做正态分布的。,样本平均数分布的平均数 、标准差 与其原总体平均数 、标准差 的关系为:,根据次数表,n=2抽样的样本平均数为:,样本平均数的方差为:,当n=4时,同理可得:,由此可获得下列两个定理:,从正态总体抽出的样本,无论样本容量的大小,其样本平均数 的抽样分布必然呈正态分布,具有平均数 和方 差 ,而且方差随样本容量的增大而降低。平均数的分布一般记为: 。,如果总体不是正态分布,但如具有一定量的 方差2和平均数,那么,

15、当样本容量足够大时 ,从这一总体抽出的样本平均数 的抽样分布也必趋近于正态分布,具有平均数 和方差 ,这称为中心极限定理。,二、均数标准误,均数标准误(平均数抽样总体的标准差) 的大小反映样本数的抽样误差的大小,即精确性的高低。 标准误( )大,说明各样本数( )间差异程度大,样本平均数的精确性低;反之, 小,说明 间的差异程度小,样本平均数的精确性高。,在实际工作中,总体标准差往往是未知的,因而无法求得。此时,可用样本标准差S估计总体 。,若样本中各观察值为x1,x2,x3xn,则样本标准误或均数标准误为,注意:样本标准差与样本标准误两个统计量之间的区别:,1.样本标准差( S )是反映样本中各变数x1,x2,x3xn之间变异程度大小的一个指标,它的大小说明了 对该样本代表性的强弱。 2.样本标准误是样本平均数 的标准差,它是 抽样误差的估计值,其大小说明了样本间变异程度的大小及 精确性的高低。,设有两个总体:,抽k个样本容量为n1,抽m个样本容量为n2,三、两样本均数差数的抽样分布,样本平均数差数分布,表3.6 抽样平均数次数分布表 f1 f2 2.0 1 1.0 1 2.5 4 1.5 2 3.0 6 2.0 3 3.5 4 2.5 2 4.0 1 3.0

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号