应用统计学第6章参数估计置信区间

举报
资源描述
第第6 6章章 参数估计参数估计-置信区间置信区间单个总体的置信区间单个总体的置信区间编辑课件区间估计概念区间估计概念 前面,我们讨论了参数点估计前面,我们讨论了参数点估计.它它是用样本算得的一个值去估计未知参数是用样本算得的一个值去估计未知参数.但是,点估计值仅仅是未知参数的一个但是,点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误近似值,它没有反映出这个近似值的误差范围,使用起来把握不大差范围,使用起来把握不大.区间估计区间估计正好弥补了点估计的这个缺陷正好弥补了点估计的这个缺陷.编辑课件我们希望确定一个区间,使我们能以比较我们希望确定一个区间,使我们能以比较高的可靠程度相信它包含真参数值高的可靠程度相信它包含真参数值.未知参数的真值未知参数的真值 “可靠程度可靠程度”是用概率来度量的,称为置信概是用概率来度量的,称为置信概率,置信度或置信水平率,置信度或置信水平.习惯上把置信水平记作习惯上把置信水平记作,这里,这里 是一个是一个很小的正数很小的正数.编辑课件 一、一、置信区间定义:置信区间定义:满足满足设设 是是 一个待估参数,给定一个待估参数,给定若由样本若由样本X1,X2,Xn确定的两个统计量确定的两个统计量则称区间则称区间 是是 的置信水平为的置信水平为 的置的置信区间信区间.分别称为置信下限和置信上限分别称为置信下限和置信上限.编辑课件N(0,1)选选 的点估计为的点估计为求参数求参数 的置信水平为的置信水平为 的置信区间的置信区间.例例1 设设X1,Xn是取自是取自 的样本,的样本,二、置信区间的求法二、置信区间的求法 寻找未知参数的寻找未知参数的一个良好估计一个良好估计.解:解:寻找一个待估参数和寻找一个待估参数和估计量的函数估计量的函数,要求,要求其分布为已知其分布为已知.有了分布,就可以求出有了分布,就可以求出Z取值于任意区间的概率取值于任意区间的概率.编辑课件对给定的置信水平对给定的置信水平查正态分布表得查正态分布表得对于给定的置信水平对于给定的置信水平,根据根据Z的分布,的分布,确定一个区间确定一个区间,使得使得Z取值于该区间的概率为取值于该区间的概率为置信水平置信水平.使使编辑课件也可简记为也可简记为于是所求于是所求 的的 置信区间为置信区间为从中解得:从中解得:编辑课件 求置信区间的一般步骤求置信区间的一般步骤(1-2):给定置信水平给定置信水平 :1.寻找参数寻找参数 的一个良好的点估计的一个良好的点估计T(X1,X2,Xn)2.寻找一个待估参数寻找一个待估参数 和估计量和估计量T的函数的函数 J(T,),且其分布为已知且其分布为已知.编辑课件3.对于给定的置信水平对于给定的置信水平 ,根据,根据J(T,)的分布,确定常数的分布,确定常数a,b,使得,使得 P(a J(T,)b)=4.对对“aJ(T,)b”作等价变形作等价变形,得到如下得到如下形式形式:则则 就是就是 的的100()的置信区间的置信区间.求置信区间的一般步骤求置信区间的一般步骤(3-4):编辑课件 可见,确定区间估计很关键的是要寻找可见,确定区间估计很关键的是要寻找一个待估参数一个待估参数 的估计量的估计量T 和函数和函数J(T,),且且J(T,)的分布为已知的分布为已知,不依赖于任何未知不依赖于任何未知参数参数(这样我们才能确定一个大概率区间这样我们才能确定一个大概率区间).而这与总体分布有关,所以,而这与总体分布有关,所以,总体分布的总体分布的形式是否已知,是怎样的类型,至关重要形式是否已知,是怎样的类型,至关重要.区间估计的关键区间估计的关键编辑课件 1.当总体为当总体为正态分布正态分布时,教材上给出时,教材上给出了几个重要的抽样分布定理了几个重要的抽样分布定理.这里不加证这里不加证明地叙述明地叙述.几个重要的抽样分布定理几个重要的抽样分布定理编辑课件 定理定理 1 样本均值的分布样本均值的分布-(已知)已知)(P.111)设设X1,X2,Xn是取自正态总体是取自正态总体的样本,则有的样本,则有编辑课件 设设X1,X2,Xn是取自正态总体是取自正态总体的样本的样本,分别为样本均值和样本方差分别为样本均值和样本方差,则有则有 定理定理 2 样本均值的一个分布样本均值的一个分布(未知)未知)P.112编辑课件 定理定理 3(样本方差的分布样本方差的分布)P.114设设X1,X2,Xn是取自正态总体是取自正态总体的样本的样本,分别为样本均值和样本方差分别为样本均值和样本方差,则有则有编辑课件定理7:设(X1,Xn)是总体的一个样本,当较大时,近似有()()2非正态总体情况非正态总体情况:编辑课件2非正态总体情况:总体XB(1,p),p称为总体比例编辑课件例例2 已知某地区新生婴儿的体重已知某地区新生婴儿的体重X随机抽查随机抽查n个婴儿个婴儿,得得n个体重数据个体重数据:X1,X2,Xn 的区间估计的区间估计求求和和(置信水平为(置信水平为1-).编辑课件解:这是单总体均值和方差的估计解:这是单总体均值和方差的估计已知已知1.先求均值先求均值 的区间估计的区间估计.因方差未知,取统计量因方差未知,取统计量对给定的置信水平对给定的置信水平使使即即确定分位数:确定分位数:编辑课件均值均值 的置信水平为的置信水平为 的区间估计的区间估计.即为即为从中解得从中解得编辑课件取统计量取统计量从中解得从中解得2.求方差求方差 的置信水平为的置信水平为 的区间估计的区间估计.使使 对给定的置信水平对给定的置信水平 ,分位数分位数确定确定编辑课件于是于是 所求置信区间为:所求置信区间为:编辑课件【例【例2】求例求例1中元中元件寿命方差件寿命方差 2 的的 95%置置信信区间。区间。n解解:由例1,S2=196.52,n=10,/2=0.025,n1-/2=0.975,故所求 2的置信区间为 (135.22,358.82)(n-1)S2/(n-1)S2/=9196.52/19.023=9196.52/2.7=135.22=358.82编辑课件 需要指出的是,给定样本,给定置信水需要指出的是,给定样本,给定置信水平,平,置信区间也置信区间也不是唯一不是唯一的。的。对同一个参数,我们可以构造许多置信对同一个参数,我们可以构造许多置信区间。区间。下面以单个总体均值下面以单个总体均值(方差已知)的置(方差已知)的置信区间估计为例来说明。信区间估计为例来说明。编辑课件N(0,1)例如,由例如,由P(-1.96U1.96)=0.95我们得到我们得到 均值均值 的置信水平为的置信水平为的的置信区间为置信区间为编辑课件我们总是希望置信区间尽可能短我们总是希望置信区间尽可能短.类似地,我们可得到若干个不同的置信类似地,我们可得到若干个不同的置信区间区间.任意两个数任意两个数a和和b,只要包含,只要包含f(u)下下95%的的面积,就确定一个面积,就确定一个95%的置信区间的置信区间.编辑课件在概率密度为单峰且对称的情形,当在概率密度为单峰且对称的情形,当a=-b时时求得的置信区间的长度为最短求得的置信区间的长度为最短.a=-b编辑课件 即使在概率密度不对称的情形,如即使在概率密度不对称的情形,如 分布分布,F分布分布,习惯上仍取对称的百分位点,习惯上仍取对称的百分位点来计算未知参数的置信区间来计算未知参数的置信区间.编辑课件 也就是说,要想得到的区间估计可靠度也就是说,要想得到的区间估计可靠度高,区间长度就长,估计的精度就差高,区间长度就长,估计的精度就差.实用中应在保证足够可靠的前提下,尽实用中应在保证足够可靠的前提下,尽量使得区间的长度短一些量使得区间的长度短一些.一对一对“矛盾矛盾”我们可以得到未知参数的的任何我们可以得到未知参数的的任何置信水置信水平的平的置信区间,并且置信区间,并且置信水平越高,相应的置信水平越高,相应的置信区间置信区间平均长度平均长度越长越长.编辑课件N(0,1)例如,由例如,由P(-1.96U1.96)=0.95我们得到我们得到 均值均值 的置信水平为的置信水平为的的置信区间为置信区间为 考虑单个正态总体考虑单个正态总体的置信区间的置信区间:当当已知时已知时,置信度与置信区间长度的关系置信度与置信区间长度的关系编辑课件由由 P(-2.33Z2.33)=0.99这个区间比前面一个要长一些这个区间比前面一个要长一些.置信区间为置信区间为我们得到我们得到 均值均值 的置信水平为的置信水平为的的 也就是说,要想得到的也就是说,要想得到的区间估计可靠区间估计可靠度高,区间长度就长,估计的精度就差度高,区间长度就长,估计的精度就差.这是一对矛盾这是一对矛盾.(.(当样本容量当样本容量n n固定时固定时)编辑课件 (1)实用中应在保证足够可靠的前提)实用中应在保证足够可靠的前提下,尽量使得区间的长度短一些下,尽量使得区间的长度短一些.(2)增大)增大样本容量样本容量n,可可在保证足够可在保证足够可靠的前提下靠的前提下,提高估计的精度提高估计的精度.解决办法:解决办法:编辑课件估计均值估计均值时的样本容量时的样本容量n确定确定1.指定估计的精度指定估计的精度:2.指定估计的可靠度指定估计的可靠度1-;3.3.确定确定:(1)(1)由历史资料确定由历史资料确定;(2)(2)预抽小样本预抽小样本n,n,计算计算s s来代替来代替;(3)(3)由其它方法估计由其它方法估计.则样本容量样本容量为:编辑课件总体均值区间估计时样本容量的确定在给定置信度和允许误差 d 的条件下,由可得 其中总体标准差或样本标准差也是未知的,通常可以先通过小规模抽样作出估计。由于使用的是近似公式,可知实际采用的最低样本容量应比计算结果稍大。编辑课件三、单侧置信区间三、单侧置信区间 上述置信区间中置信限都是双侧的,但上述置信区间中置信限都是双侧的,但对于有些实际问题,人们关心的只是参数在对于有些实际问题,人们关心的只是参数在一个方向的界限一个方向的界限.例如对于设备、元件的使用寿命来说,平均例如对于设备、元件的使用寿命来说,平均寿命过长没什么问题,过短就有问题了寿命过长没什么问题,过短就有问题了.这时,可将置信上限取为这时,可将置信上限取为+,而只着,而只着眼于置信下限,这样求得的置信区间叫单眼于置信下限,这样求得的置信区间叫单侧置信区间侧置信区间.编辑课件单侧置信区间和置信限的定义:单侧置信区间和置信限的定义:满足满足设设 是是 一个待估参数,给定一个待估参数,给定 若由样本若由样本X1,X2,Xn确定的统计量确定的统计量则称区间则称区间 是是 的置信水平为的置信水平为 的的单侧置信区间单侧置信区间.称为单侧置信下限称为单侧置信下限.编辑课件又若统计量又若统计量 满足满足则称区间则称区间 是是 的置信水平为的置信水平为 的的单侧置信区间单侧置信区间.称为单侧置信上限称为单侧置信上限.编辑课件【例【例5】(1)求例1中元件平均寿命的95%置信下限。(2)求元件寿命方差的95%置信上限。解解:(1)从而 的单侧 1-置信下限为本例中,t 0.05(9)=1.8331,故所求置信下限为1423.1-1.8331196.5/该在95%的置信度下,该元件的平均寿命大于1309.2小时。=1390.2可得由6.4 单侧置信限的区间估计 编辑课件同理可得 2 的置信度为 1-的单侧置信上限为本例中,故所求2的95%置信上限为 9196.52/3.325=323.32(小时2)由以上分析可知,求单侧置信限与求双侧置信限的差别仅在于用相应分布的右侧 分位点代替双侧区间估计公式中的右侧/2 分位点。解解(2)(2):2 的的置信置信上限上限编辑课件 3 总体比例总体比例p的的 置信区间置信区间 设总体设总体XB(1,p),即即X只取两个值只取两个值:X=1(具有某属性具有某属性),概率为概率为p;X=0(不具有某属性不具有某属性),概率为概率为1-p.其中其中,p称为称为总体比例总体比例,即具有某属性的即具有某属性的人在总体中所占的比例人在总体中所占的比例.从总体从总体X抽取
展开阅读全文
温馨提示:
金锄头文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
相关搜索

当前位置:首页 > 高等教育 > 教育学


电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号