《第五参数估计》由会员分享,可在线阅读,更多相关《第五参数估计(42页珍藏版)》请在金锄头文库上搜索。
1、第五章第五章第五章第五章 参数估计参数估计参数估计参数估计一、参数估计的基本原理一、参数估计的基本原理二、总体不同参数的估计方法二、总体不同参数的估计方法三、样本容量的计算方法三、样本容量的计算方法第一节第一节 参数估计的基本原理参数估计的基本原理Parameter estimation指研究如何用样本统计量指研究如何用样本统计量推断出总体参数值。推断出总体参数值。 一、参数估计的定义一、参数估计的定义Parameter estimation:研究从样本获:研究从样本获得一组数据后,如何通过这组信息,对总得一组数据后,如何通过这组信息,对总体特征进行估计,也就是如何从局部结果体特征进行估计,也
2、就是如何从局部结果推论总体的情况。推论总体的情况。 二、估计量与估计值二、估计量与估计值1、估计量:对总体参数进行估计的相应的样本指标称为样、估计量:对总体参数进行估计的相应的样本指标称为样本估计量。本估计量。 常有常有 、s2、p2、估计值:指统计量的一个具体数值。、估计值:指统计量的一个具体数值。 例:抽样例:抽样30人,测得平均成绩为人,测得平均成绩为82分,则分,则 为估计量,为估计量,82为估计值为估计值 思考假设你正在研究平均一个人一生中要得到多少假设你正在研究平均一个人一生中要得到多少交通罚单。报告研究结果的方法有以下两种:交通罚单。报告研究结果的方法有以下两种:“10”或者或者
3、“8到到12之间之间”,请考虑它们各自的,请考虑它们各自的优缺点。优缺点。二、点估计与区间估计二、点估计与区间估计(一)点估计(一)点估计点估计(点估计(point estimation):又称定值估计,指直接用样本的一个观察值):又称定值估计,指直接用样本的一个观察值(估计值)来估计总体参数值。(估计值)来估计总体参数值。 良好估计量的标准良好估计量的标准无偏性无偏性 即用多个样本的统计量作为总体参数的估计值,其偏差为即用多个样本的统计量作为总体参数的估计值,其偏差为0。有效性有效性 当总体参数的无偏估计不止一个时,无偏估计变异小的有效性高。当总体参数的无偏估计不止一个时,无偏估计变异小的有
4、效性高。一致性一致性 当样本容量无限增大时,估计值应能够越来越接近它所估计的总体参数当样本容量无限增大时,估计值应能够越来越接近它所估计的总体参数充分性充分性 指一个容量为指一个容量为n的统计量,是否充分反映了全部的统计量,是否充分反映了全部n个数据。个数据。 (二)区间估计(二)区间估计区间估计(区间估计(interval estimation):指按一定的概率):指按一定的概率(置信度)来估计总体参数的取值范围。(置信度)来估计总体参数的取值范围。 例如例如: 总体均值落在总体均值落在5070之间,置信度为之间,置信度为 95%样本统计量样本统计量样本统计量样本统计量 ( (点估计点估计点
5、估计点估计) )置信区间置信区间置信区间置信区间置信下限置信下限置信下限置信下限置信上限置信上限置信上限置信上限图图5-1区间估计及相关概念区间估计及相关概念置信度与显著性水平:置信度与显著性水平:1-:称为置信概率或置信水平、置信系数,:称为置信概率或置信水平、置信系数,一般取一般取95%、99%两个值。两个值。:称为显著性水平(或小概率),一般取:称为显著性水平(或小概率),一般取0.05和和0.01两个水平。两个水平。 三、三、参数估计的一般公式参数估计的一般公式 三、三、参数估计的一般公式参数估计的一般公式 (二)公式:(二)公式: 样本统计量样本统计量 极限误差极限误差 (1)样本统
6、计量包括样本均值、率、标准差)样本统计量包括样本均值、率、标准差 (2) = 大小概率的临界值大小概率的临界值抽样误差抽样误差 (3) 例:抽取例:抽取250名大学生,测得其平均名大学生,测得其平均IQ为为115,已知人群中,已知人群中IQ标准标准差为差为15,试以,试以95%的置信度推断中国大学生的平均的置信度推断中国大学生的平均IQ?解:解:=0.05 临界值临界值Z/2=1.96 样本均值为样本均值为115 代入上式有代入上式有: 下限下限 115-1.960.95=113.14 上限上限 115+1.960.95=116.86 即在即在95%置信度下,估计中国大学生的平均置信度下,估计
7、中国大学生的平均IQ为为113.14116.86 第二节第二节 常用区间估计公式及应用常用区间估计公式及应用 一、总体均值的区间估计一、总体均值的区间估计(一一)公式公式 (P140 表表5.6)(二)应用(二)应用步骤:步骤:1 、根据实际样本的数据,计算样本的平均数和标准差。根据实际样本的数据,计算样本的平均数和标准差。2 、计算抽样误差(包括总体方差已知、总体方差未知两种情况)。、计算抽样误差(包括总体方差已知、总体方差未知两种情况)。3 、确定置信水平或显著性水平。、确定置信水平或显著性水平。4 、根据样本平均数的抽样分布,确定查何种临界值表。、根据样本平均数的抽样分布,确定查何种临界
8、值表。5 、计算置信区间。、计算置信区间。6 、解释总体平均数的置信区间。、解释总体平均数的置信区间。综合例一:总体均值的置信区间综合例一:总体均值的置信区间 ( 已知已知)1.假定条件假定条件总体服从正态分布总体服从正态分布, ,且总体方差(且总体方差( )已知已知如果不是正态分布,可以由正态分布来近似如果不是正态分布,可以由正态分布来近似 (n 30)2. 2. 总体均值总体均值 在在1-1- 置信水平下的置信水平下的置信区间为置信区间为(P139 5.2)例例1:已知总体为正态分布,:已知总体为正态分布,=7.07=7.07,从总体中随机抽取,从总体中随机抽取n=10n=10的样本,计算
9、出样本的平均数为的样本,计算出样本的平均数为7878,试问总体均值,试问总体均值的的95%95%置信区间。置信区间。解:总体方差已知,则区间为解:总体方差已知,则区间为 *P137 P137 例例5.15.1解解:已已知知N( ,0.152), x2.14, n=9, 1- = 0.95, /2=1.96 总体均值总体均值 的置信区间为的置信区间为我我们们可可以以95的的概概率率保保证证该该种种零零件件的的平平均均长长度度在在21.30221.498 mm之间之间【例例2】某某种种零零件件长长度度服服从从正正态态分分布布,从从该该批批产产品品中中随随机机抽抽取取件件,测测得得其其平平 均均 长
10、长 度度 为为 21.4 mm。已已知知总总体体标标准准差差 =0.15mm,试试建建立立该该种种零零件件平平均均长长度度的的置置信信区区间间,给给 定定 置置 信信 水水 平平 为为0.95。关于置信区间长度的小结样本量影响置信区间长度。大样本产生较短的置信区间。样本量影响置信区间长度。大样本产生较短的置信区间。置信水平影响置信区间。置信水平越高产生的置信区间置信水平影响置信区间。置信水平越高产生的置信区间较短。较短。短的置信区间能比长的置信区间提供更多的有关总体参短的置信区间能比长的置信区间提供更多的有关总体参数的信息。数的信息。综合例二:总体均值的置信区间综合例二:总体均值的置信区间 (
11、 未知未知,小样本小样本)1.假定条件假定条件总体方差(总体方差( )未知未知 ,n小于小于30总体必须服从正态分布总体必须服从正态分布2.使用使用 t 分布统计量分布统计量3. 3.3. 总体均值总体均值总体均值 在在在1-1-1- 置信水平下的置信水平下的置信水平下的置信区间置信区间置信区间为为为(P139 5.5解解:已已知知N( , 2), x=50, s=8, n=25, 1- = 0.95,t /2=2.0639。我我们们可可以以95的的概概率率保保证证总总体体均均值值在在46.6953.30 之间之间【例例】从从一一个个正正态态总总体体中中抽抽取取一一个个随随机机样样本本, n
12、= 25 ,其其均均值值 x = 50 ,标标准准差差 s = 8。 建建立立总总体体均均值值 的的95%的置信区间。的置信区间。二、总体比率与方差的区间估计二、总体比率与方差的区间估计(一一)公式公式 (二二)应用应用1、总体标准差与方差的区间估计、总体标准差与方差的区间估计:当样本容量大于当样本容量大于30时,样本标准差的分布渐进正态分布,标准差时,样本标准差的分布渐进正态分布,标准差的平均数为:的平均数为:,标准差分布的标准差为:,标准差分布的标准差为:/ / 例:有一个随机样本例:有一个随机样本n=31n=31,s=5s=5,试在,试在0.950.95的置信度下,估计总体的置信度下,估
13、计总体标准差的置信区间标准差的置信区间? ? SZ/2 *P142 例例 5.5 方差估计方差估计2、总体率的区间估计、总体率的区间估计当样本容量大于当样本容量大于30时,时, pZ/2 例:有一个随机样本例:有一个随机样本n=100n=100,男生的比率为,男生的比率为48%48%,试在,试在0.950.95的置信度下,估计总体标准差的置信区间问该样的置信度下,估计总体标准差的置信区间问该样本总体率的置信区间本总体率的置信区间? ?三、两个参数之差的区间估计三、两个参数之差的区间估计(一一)公式公式 P151 表表5.13 类别类别分布公式分布公式 置信区间置信区间双双样样本本均均值值之之差
14、差的的区区间间估估计计1、 条件条件:两正态总体,方差已知,无限总体或两正态总体,方差已知,无限总体或有限总体有限总体N1、N2很大很大2、条件:两正态总体,方差未知,无限总体或条件:两正态总体,方差未知,无限总体或有限总体有限总体N很大,很大,n1、n2303、条件:两正态总体,方差未知且相等,小样条件:两正态总体,方差未知且相等,小样本(本(n1、n230)4、条件:两正态或非正态总体,方差未知不相条件:两正态或非正态总体,方差未知不相等,小样本(等,小样本(n1、n230,且不相等)且不相等)双样双样本比本比率之率之差差5、p1-p2N(1-2,1(1-1)/n1+2 (1-2)/n2)
15、 条件:大样本条件:大样本(二)双样本之差区间估计例题分析(二)双样本之差区间估计例题分析P144 例例5.6 方差未知大样本方差未知大样本;P145 例例5.7 方差未知小样本,且两个方差相等方差未知小样本,且两个方差相等;P149 例例5.10 双样本比率之差双样本比率之差.第三节第三节 样本量计算样本量计算一、估计总体平均数时的样本容量计算一、估计总体平均数时的样本容量计算均值类研究问题的样本量计算。均值类研究问题的样本量计算。 1、无限总体,或有限总体、无限总体,或有限总体N很大时很大时 Z/2 n= (P153 5.29) 的确定方法的确定方法(1)查资料法)查资料法; (2)预调查
16、法()预调查法(30人左右),抽取一个人左右),抽取一个 样本,用样本样本,用样本s替代总体替代总体值。值。 的确定方法:由研究者依据精确度或经验给出。的确定方法:由研究者依据精确度或经验给出。 2、有限总体,不重复抽样(社会调查研究中重复调查会影响调有限总体,不重复抽样(社会调查研究中重复调查会影响调查结果)查结果) N Z/2 n= N + Z/2例:宁强试验点例:宁强试验点6-14岁儿童的平均智商调查中的样本量设计。岁儿童的平均智商调查中的样本量设计。 已知两乡总儿童数为已知两乡总儿童数为1850人人解:依据韦氏儿童解:依据韦氏儿童IQ测验常模知测验常模知=15,=0.05,=3, N=
17、1850 由于韦氏测验不能用重复测验,则得由于韦氏测验不能用重复测验,则得: N Z/2 n= =91(人) N + Z/2均值类问题研究样本量计算示例分析均值类问题研究样本量计算示例分析二、估计总体率时的样本容量计算二、估计总体率时的样本容量计算率类研究问题的样本量计算。率类研究问题的样本量计算。1、无限总体,或有限总体、无限总体,或有限总体N很大时很大时 Z/2pq n= - (P154 5.31) p p确定方法:(确定方法:(1)用以往研究资料中给出的)用以往研究资料中给出的p值;值; (2)预调查法()预调查法(50人左右),用样本人左右),用样本p值;值; (3)社会调查中,往往采
18、用)社会调查中,往往采用p=50%。p 确定方法:由研究者依据精确度或经验给出。确定方法:由研究者依据精确度或经验给出。 2、有限总体,不放回抽样(社会调查研究中重复调、有限总体,不放回抽样(社会调查研究中重复调查会影响调查结果)查会影响调查结果) N Z/2 pq n= Np+ Z/2 pq 例:宁强试验点例:宁强试验点014岁儿童岁儿童MR患病率调查中的样本量设计患病率调查中的样本量设计解:查资料得到全国解:查资料得到全国1988年调查资料中全国年调查资料中全国014岁儿童岁儿童MR患患病率为病率为1.2%,=0.05,p=0.3% 则得则得: Z/2pq n= = 5060 (人) p
19、率类问题研究样本量计算示例分析率类问题研究样本量计算示例分析三、研究两个总体平均数的差异性时的样本容量计算三、研究两个总体平均数的差异性时的样本容量计算(两组差异性分析时两组差异性分析时) Z/2(1 +2) n1=n2= (P154 5.32) 例:研究干预前、干预后儿童例:研究干预前、干预后儿童IQ的差异性分析的差异性分析 解:依据韦氏儿童解:依据韦氏儿童IQ测验常模知测验常模知=15,=0.05,=3 Z/2(1 +2) n1=n2= =100(人) 即干预前后,各应抽即干预前后,各应抽100人进行调查。人进行调查。四、研究两个总体比率的差异性时的样本容量四、研究两个总体比率的差异性时的
20、样本容量计算计算 Z/2(p1q1+p2q2) n1=n2= (P155 5.33) p *无无p1、p2信息时,用信息时,用50%法法 例:研究干预前、干预后儿童例:研究干预前、干预后儿童MR患病率的差异性患病率的差异性 解:干预前率解:干预前率3.27%,干预后下降到,干预后下降到2%以下,以下,=0.05, p=0.5% Z/2(p1q1+p2q2) n1=n2= =8256(人) p 本章小节:本章小节: 本章应重点掌握本章应重点掌握 (1)区间估计的通用公式;)区间估计的通用公式;(2)常用区间估计公式)常用区间估计公式的应用条件的应用条件; (3)均值与率估计研究中样本量计算的公式。)均值与率估计研究中样本量计算的公式。