第四章总体均数的估计

上传人:cn****1 文档编号:571448944 上传时间:2024-08-10 格式:PPT 页数:27 大小:1.27MB
返回 下载 相关 举报
第四章总体均数的估计_第1页
第1页 / 共27页
第四章总体均数的估计_第2页
第2页 / 共27页
第四章总体均数的估计_第3页
第3页 / 共27页
第四章总体均数的估计_第4页
第4页 / 共27页
第四章总体均数的估计_第5页
第5页 / 共27页
点击查看更多>>
资源描述

《第四章总体均数的估计》由会员分享,可在线阅读,更多相关《第四章总体均数的估计(27页珍藏版)》请在金锄头文库上搜索。

1、第四章第四章 总体均数的估总体均数的估计计一、均数的抽样误差一、均数的抽样误差 抽样的目的是用样本信息来推断总体特征,因此要抽样的目的是用样本信息来推断总体特征,因此要保证样本的可靠性和代表性,使样本能够充分地反映总保证样本的可靠性和代表性,使样本能够充分地反映总体的真实情况。这就要求严格遵循独立性和随机化的原体的真实情况。这就要求严格遵循独立性和随机化的原则,并保证足够的样本含量。则,并保证足够的样本含量。 为了解某地成年男子红细胞的总体均数,随机抽样为了解某地成年男子红细胞的总体均数,随机抽样调查了调查了200人,计算得到人,计算得到 这是一个点估计值,可以用来估计总体均数这是一个点估计值

2、,可以用来估计总体均数。但此时。但此时样本均数不太可能等于总体均数。样本均数不太可能等于总体均数。 这种由个体变异产生的、随机抽样而引起的统计这种由个体变异产生的、随机抽样而引起的统计量与总体参数间的差异称为的抽样误差(量与总体参数间的差异称为的抽样误差(sampling error),在抽样研究中抽样误差是不可避免的,只要在抽样研究中抽样误差是不可避免的,只要抽样就会有抽样误差存在,但是抽样误差的分布有一抽样就会有抽样误差存在,但是抽样误差的分布有一定的规律性,并且可以通过一定的方法来估计。定的规律性,并且可以通过一定的方法来估计。 根据数理统计原理,样本均数抽样结果具有如下特点:根据数理统

3、计原理,样本均数抽样结果具有如下特点: 从从正正态态总总体体N N(, 2 2)中中,随随机机抽抽取取例例数数为为n n的的样样本本,样样本本均均数数也也服服从从正正态态分分布布,即即使使是是从从偏偏态态总总体体中中抽抽样样,当当n n足够大时足够大时,样本均数的分布也服从正态分布;样本均数的分布也服从正态分布; 从从均均数数为为,标标准准差差为为 的的正正态态或或偏偏态态总总体体中中,抽抽取取例例数数为为n n的的样样本本,样样本本均均数数的的均均数数 ,标标准准差差为为 。 是是样样本本均均数数的的标标准准差差也也称称为为标标准准误误,它它反反映映了了样样本本均均数数与与总总体体均均数数之

4、之间间的的离离散散程程度度,常常用用以以说说明明均均数数抽样误差的大小。抽样误差的大小。 标准误的计算公式如下:标准误的计算公式如下: 该该式式反反映映了了标标准准误误 的的大大小小与与标标准准差差 呈呈正正比比,与与样样本本量量的的平平方方根根呈呈反反比比。因因此此,在在抽抽样样研研究究中中,可可适当增加样本含量,控制和减小抽样误差。适当增加样本含量,控制和减小抽样误差。 在在实实际际工工作作中中,总总体体标标准准差差 常常是是未未知知的的而而是是用用样样本本标准差标准差s s 来代替,来代替, 的估计值记作的估计值记作 。 从 N(4.83, 0.522)的总体中作随机抽样,的总体中作随机

5、抽样,n=10, 重复重复100次的抽样结果见次的抽样结果见P31。计算得到:。计算得到: 随机抽样调查了随机抽样调查了200人,计算得到人,计算得到 :估计其抽样误差:估计其抽样误差: 标准误的用途标准误的用途 标标准准误误是是反反映映样样本本均均数数变变异异程程度度的的指指标标,常常用用来来表表示示抽抽样样误误差差的的大大小小。标标准准误误大大反反映映样样本本均均数数抽抽样样误误差差大大,其其对对总总体体均均数数的的代代表表性性差差;标标准准误误小小,样样本本均均数抽样误差就小,其对总体均数的代表性就好。数抽样误差就小,其对总体均数的代表性就好。 标标准准误误可可用用于于计计算算总总体体均

6、均数数的的可可信信区区间间,也也是是进进行假设检验的基础。行假设检验的基础。标准差和标准误的区别标准差和标准误的区别意义:意义:标标准准差差描描述述个个体体值值间间的的变变异异程程度度,即即观观察察值值间间的的离离散散度度,标标准准差差小小,表表示示观观察察值值围围绕绕均均数数的的波波动动较较小小。当当观观察察值值呈呈正正态态或或近近似似正正态态分分布布时时,可可将将均均数数及及标标准差同时写出,如准差同时写出,如 。标标准准误误描描述述统统计计量量的的抽抽样样误误差差的的大大小小,即即样样本本统统计计量量与与总总体体参参数数的的接接近近程程度度。标标准准误误小小,表表示示抽抽样样误误差小,则

7、统计量较稳定,与参数较接近。差小,则统计量较稳定,与参数较接近。标准差和标准误的区别标准差和标准误的区别用途用途标标准准差差表表示示观观察察值值间间波波动动的的大大小小,如如精精密密度度的的大大小小,当当资资料料服服从从正正态态或或近近似似正正态态分分布布时时,可可结结合合均均数数估估计正常值范围:计正常值范围: 标标准准误误表表示示抽抽样样误误差差的的大大小小,用用于于估估计计总总体体参参数数的的可信区间:可信区间:标准差、标准误与样本含量的关系标准差、标准误与样本含量的关系 标标准准差差随随着着样样本本量量的的增增多多,逐逐渐渐趋趋于于稳稳定定,如如同同地地区区、同同年年龄龄、同同性性别别

8、儿儿童童的的身身高高、体体重重的的标标准准差差,当当样样本含量达到约本含量达到约200200以上时,基本趋于稳定。以上时,基本趋于稳定。 标标准准误误随随着着样样本本量量的的增增多多而而减减小小,如如均均数数的的标标准准误误,当标准差不变时,与样本量的平方根呈反比。当标准差不变时,与样本量的平方根呈反比。 当当样样本本含含量量趋趋近近于于总总体体例例数数时时,则则样样本本标标准准差差趋趋于于稳稳定定,近近似似等等于于总总体体标标准准差差;标标准准误误则则趋趋近近于于0 0,抽抽样样误误差几乎消失。差几乎消失。二、均数抽样误差的分布二、均数抽样误差的分布t分布分布 在在总总体体均均数数为为 ,标

9、标准准差差为为 的的正正态态总总体体中中,独独立立随随机机的的抽抽取取样样本本含含量量为为n的的样样本本,则则样样本本均均数数服服从从正正态分布态分布 : 将样本均数标准化,则:将样本均数标准化,则: 其其中中的的分分母母称称为为均均数数的的标标准准误误,如如果果变变量量是是正正态态的的或或近近似似正正态态的的,则则标标准准化化的的变变量量服服从从或或近近似似服服从从N(0,1)分布,即分布,即u分布。分布。 若若上上式式中中的的 是是未未知知的的,可可用用样样本本标标准准差差s代代替替总总体体标标准准差差 ,此此时时采采用用的的不不是是 u 变变换换而而是是 t 变变换换了了,即:即: 其其

10、结结果果就就不不再再服服从从标标准准正正态态分分布布了了,而而是是服服从从自自由度为由度为n-1 的的 t 分布。分布。 t 分分布布也也是是一一种种对对称称分分布布,它它只只有有一一个个参参数数,即即自自由由度度。t 分布与标准正态分布相比有以下特征:分布与标准正态分布相比有以下特征: 二者都是单峰分布,以二者都是单峰分布,以0为中心,左右两侧对称。为中心,左右两侧对称。 t 分分布布的的峰峰部部较较矮矮而而尾尾部部翘翘得得较较高高,说说明明远远侧侧 t 值值的的个个数数相相对对较较多多,即即尾尾部部面面积积(概概率率P)较较大大。自自由由度度越越小小这种情况越明显。这种情况越明显。 t分分

11、布布不不是是一一条条曲曲线线,而而是是由由一一簇簇随随自自由由度度改改变变而而变变化化的的曲曲线线所所组组成成。当当 逐逐渐渐增增大大时时,t 分分布布逐逐渐渐逼逼近近标标准准正正态分布;当态分布;当 = 时,时,t分布就完全成为标准正态分布了。分布就完全成为标准正态分布了。t 界值界值 统统计计学学家家已已将将各各种种自自由由度度对对应应的的t分分布布曲曲线线下下的的尾部面积(概率)的百分界值编制成尾部面积(概率)的百分界值编制成t界值表。界值表。 由由于于t分分布布是是以以0为为中中心心的的对对称称分分布布,故故表表中中只只列出正值,所以查表时,不管列出正值,所以查表时,不管t 值正负只用

12、绝对值。值正负只用绝对值。 表表右右上上角角插插图图中中阴阴影影部部分分,表表示示t,以以外外尾尾部部面面积占总面积的百分数,即概率积占总面积的百分数,即概率P。 随随着着自自由由度度 的的增增大大,t界界值值逐逐渐渐减减小小,当当自自由由度度无无穷穷大大时时,双双侧侧t0.05=1.96,单单侧侧t0.05,=1.645,即即为为u分布的界值。分布的界值。 如如由由表表查查出出单单侧侧t0.05,10=1.812,表表示示从从正正态态总总体体作作样样本本例例数数为为11的的随随机机抽抽样样,其其t 值值服服从从 =n-1=11-1=10的的t 分布,理论上分布,理论上 P(t-1.812)=

13、0.05,或或P(t1.812)=0.05 用更一般的表示法为用更一般的表示法为单侧:单侧:P(t-t,)=,或或P(tt,)=双侧:双侧:P(t-t,)+P(tt,)= 反之反之 P(-t,tt,)=1-总体均数的估计总体均数的估计 参参数数估估计计是是通通过过样样本本指指标标(统统计计量量)来来估估计计总总体体指指标标(参数(参数)。)。它包括两种方法:它包括两种方法:点点(值值)估估计计(point estimation):即即把把样样本本统统计计量量直直接接作作为为总总体体参参数数的的估估计计值值,如如用用样样本本均均数数来来估估计计总总体体均均数数。这这种种方方法法虽虽然然很很简简单

14、单,但但是是未未涉涉及及随随机机误误差,而随机误差在抽样研究中是不可忽视的。差,而随机误差在抽样研究中是不可忽视的。区区间间估估计计(interval estimation)即即按按一一定定的的概概率率估估计计总总体体均均数数在在哪哪个个范范围围,它它把把抽抽样样误误差差引引入入估估计计量量,确定具有特定概率意义的区间。确定具有特定概率意义的区间。可信区间与参考值范围可信区间与参考值范围 可可信信区区间间是是从从总总体体中中作作随随机机抽抽样样,每每个个样样本本可可以以算算出出一一个个可可信信区区间间,如如95%可可信信区区间间,意意味味着着100次次抽抽样样,算算得得100个个可可信信区区间

15、间,平平均均有有95个个可可信信区区间间包包括括总总体体均均数数(估估计计正正确确),只只有有5个个可可信信区区间间不不包包括括总总体体均均数数(估估计计错错误误)。5%是是小小概概率率事事件件,实实际际发发生生的的可可能能性性小小,因因此此,在在实实际际应应用用中中就就认认为为总总体体均均数数在在算算得得的的可可信信区区间间内内, 这这种种估计方法会冒估计方法会冒5%犯错误的风险。犯错误的风险。 参参考考值值范范围围是是指指同同质质总总体体中中大大多多数数个个体体变变量量值值的的分分布布范范围围。95%参参考考值值范范围围指指同同质质总总体体中中95%的的个个体体值值分分布布在在此此范范围围

16、内内。它它与与标标准准差差有有关关,各各个个体体值值变变异异越越大大,该该范范围围越宽,分布也越分散。越宽,分布也越分散。 可信区间和可信限可信区间和可信限可信限(可信限(CL)分别指两个点值。分别指两个点值。可信区间(常简记为可信区间(常简记为CI)是以上、下可信限为界是以上、下可信限为界的一个范围。的一个范围。比如可信区间比如可信区间(5.31, 5.45) 1012/L的下限是的下限是5.31 1012/L,上限是上限是5.45 1012/L 。区间估计区间估计l 设设有有一一正正态态总总体体N(, 2),现现从从中中随随机机抽抽取取一一个个样样本本,该该样样本本的的均均数数和和标标准准

17、差差分分别别用用 和和s表表示示,样样本本均均数数的的标标准准t离离差差服服从从t分分布布,则则可可信信度度为为(1- )的)的t值满足:值满足: P(-t, t t,)=1- 将将 代入不等式,即:代入不等式,即: 于于是是得得可可信信度度为为1- 时时,计计算算总总体体均均数数可可信信区区间间的通式为:的通式为: 习习惯惯上上,常常取取1- =0.95, 即即95%可可信信区区间间;或或取取1- =0.99, 即即99%可信区间。可信区间。 未知时。一般用未知时。一般用t t分布的原理作区间估计。分布的原理作区间估计。 已知已知 未知,但未知,但n n足够大足够大 例例:对对某某人人群群随

18、随机机抽抽取取20人人,用用某某批批号号的的结结核核菌菌素素作作皮皮试试,平平均均浸浸润润直直径径为为10.9mm,标标准准差差为为3.86mm。问问这这批批结结核核菌菌素素在在该该人人群群中中使使用用时时,皮试的平均浸润直径的皮试的平均浸润直径的95%可信区间是多少?可信区间是多少? 查附表,查附表,t0.05,19=2.093 所所以以该该人人群群皮皮试试的的平平均均浸浸润润直直径径的的95%可可信信区区间为间为9.112.7mm 。可信区间的两个要素可信区间的两个要素 准确度:反反映映在在可可信信度度1- 的的大大小小,即即区区间间包包含含总总体体均数的概率的大小,当然愈接近均数的概率的

19、大小,当然愈接近1愈好;愈好; 精度:反映在区间的长度,当然长度愈小愈好反映在区间的长度,当然长度愈小愈好。 在在样样本本例例数数确确定定的的情情况况下下,二二者者是是矛矛盾盾的的。一一般般情情况况下下,在在可可信信度度确确定定的的情情况况下下,增增加加样样本本例例数数,可可减减少区间长度,提高精度。少区间长度,提高精度。小结 在在正正态态总总体体N(, 2)中中作作随随机机抽抽样样,样样本本均均数数的的分分布布呈呈正正态态分分布布,当当总总体体标标准准差差未未知知,用用 作作为为标标准准误误的的估估计计值值,样样本本均均数数的的分分布布呈呈t分分布布,t分分布布是是随随自自由由度度的的改改变变而而变变化化的的一一簇簇曲曲线线,因因此此应应注注意意自自由由度度的的大大小小。参参数估计是通过样本指标来估计总体指标。数估计是通过样本指标来估计总体指标。 点点(值值)估估计计:即即把把样样本本统统计计量量直直接接作作为为总总体体参参数数的的估计值。估计值。 区区间间估估计计即即按按一一定定的的概概率率估估计计总总体体均均数数在在哪哪个个范范围围。它它把把抽抽样样误误差差引引入入估估计计量量,是是确确定定具具有有特特定定概概率率意意义义的的区间。区间。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号