第5章参数估计基础2讲解材料

上传人:yuzo****123 文档编号:271411105 上传时间:2022-03-29 格式:PPT 页数:63 大小:464KB
返回 下载 相关 举报
第5章参数估计基础2讲解材料_第1页
第1页 / 共63页
第5章参数估计基础2讲解材料_第2页
第2页 / 共63页
第5章参数估计基础2讲解材料_第3页
第3页 / 共63页
第5章参数估计基础2讲解材料_第4页
第4页 / 共63页
第5章参数估计基础2讲解材料_第5页
第5页 / 共63页
点击查看更多>>
资源描述

《第5章参数估计基础2讲解材料》由会员分享,可在线阅读,更多相关《第5章参数估计基础2讲解材料(63页珍藏版)》请在金锄头文库上搜索。

1、第五章第五章 参数估计基础参数估计基础 第五章第五章 由抽样造成的样本均数与总体均数及样本均数由抽样造成的样本均数与总体均数及样本均数之间的差别称为均数的抽样误差。之间的差别称为均数的抽样误差。 第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误一、均数的抽样误差一、均数的抽样误差抽样误差抽样误差: 抽样研究中,样本统计量与总体参数间的差别及抽样研究中,样本统计量与总体参数间的差别及统计量与统计量间的差别统计量与统计量间的差别称为抽样误差。称为抽样误差。均数的抽样误差均数的抽样误差: 二、标准误的计算二、标准误的计算【例【例5-1】假设已知假设已知100名(总体)正常成年男性红名(总体

2、)正常成年男性红细胞数的均值为细胞数的均值为5.00 1012/L,标准差为,标准差为0.43 1012/L,现从该总体中进行随机抽样,每次,现从该总体中进行随机抽样,每次抽取抽取10名正常成年男子,并测得他们的红细胞数,名正常成年男子,并测得他们的红细胞数,最终共抽取最终共抽取100份样本,并计算出每份样本的均数。份样本,并计算出每份样本的均数。将一百个样本均数看成一批资料或为一个新样本,我们可以计算其均数与标准差,均数值为4.9097,标准差为0.1350。将样本均数的“标准差”定名为均数的标准误,简称标准误,以区别于通常所说的标准差。标准差表示个体值的变异程度,而标准误则说明样本均数的变

3、异程度,两者不能混淆。将第将第1号样本的标准差及例数代入式(号样本的标准差及例数代入式(5-2),得),得 (5-2) (5-1) 100 100个样本均数的频数分布图个样本均数的频数分布图标准误标准误统计量的标准差称为标准误(如均数标准统计量的标准差称为标准误(如均数标准误、率的标准误);均数的标准误是描述均数误、率的标准误);均数的标准误是描述均数抽样误差大小的统计指标。抽样误差大小的统计指标。 标准误的用途:标准误的用途:1.衡量样本均数的可靠性。衡量样本均数的可靠性。2.结合样本均数和正态分布曲线下的面积结合样本均数和正态分布曲线下的面积 分布规律,估计总体均数的置信区间。分布规律,估

4、计总体均数的置信区间。3.用于均数的假设检验。用于均数的假设检验。思考题:标准误和标准差的区别?思考题:标准误和标准差的区别?则则 zN(0,1)第二节第二节 t t 分布分布 则则 zN(0,1););(, ),作),作 z 转换转换xN(,),作),作 转换,转换, 一、一、 t t 分布分布 的概念的概念t 变变量量为为用用以以推推断断总总体体均均数数的的样样本本检检验验统统计计量。量。t 分布只有分布只有1个参数自由度个参数自由度n1。1.当当 已知时,可作已知时,可作 z 转换,推断总体均转换,推断总体均数的样本检验统计量为数的样本检验统计量为z。2.当当 未知时,可作正态变量未知时

5、,可作正态变量 的的 t 转换,转换,二、二、t 分布的特征与分布的特征与t界值表界值表 图图5-1 不同自由度不同自由度t分布的概率密度曲线分布的概率密度曲线3.当当 时,时,t 分布逼近分布逼近z 分布;分布; 特征:特征:1. 单峰分布,以单峰分布,以0为中心,左右对称;为中心,左右对称;2. 越小,越小,t 值越分散,值越分散,t 分布的峰部越矮分布的峰部越矮而尾部翘得越高;而尾部翘得越高;4.t 分布曲线下的面积有一定规律。分布曲线下的面积有一定规律。双侧:双侧: 单侧:单侧:图图5-2 = 9时单侧(时单侧(a)与双侧()与双侧(b)分布曲线下尾部面积)分布曲线下尾部面积第三节 总

6、体均数的估计【例【例5-2】 随机抽取某地随机抽取某地100名名16岁男孩,岁男孩,测得其体重均数为测得其体重均数为48.65kg,标准差为,标准差为15.23kg,试估计该地,试估计该地16岁男孩体重的总体均数。岁男孩体重的总体均数。 一、点估计一、点估计(point estimation)(point estimation) 用样本统计量作为总体参数的点值估计用样本统计量作为总体参数的点值估计二、区间估计(二、区间估计(interval estimation) 结合样本统计量和抽样误差在一定结合样本统计量和抽样误差在一定的可信度的可信度100(1- )%下估计总体参下估计总体参数所在的范围

7、,称为总体参数的置信数所在的范围,称为总体参数的置信区间(区间(confidence interval ,CI)。)。 置信区间的概念置信区间的概念1.Z分布法分布法正态分布原理计算总体均数的正态分布原理计算总体均数的1-1- 可信区间为:可信区间为: /2/21-z/2z/2(1)已知(小样本要求已知(小样本要求资料服从正态)资料服从正态)均数置信区间的计算均数置信区间的计算(2) 未知,但样本例数未知,但样本例数n足够大时(足够大时(50) 注意注意:若总体不服从正态分布时,一般是若总体不服从正态分布时,一般是很难确定其总体中的未知参数,但当样本很难确定其总体中的未知参数,但当样本量量n很

8、大时,我们可利用中心极限定理按很大时,我们可利用中心极限定理按上式对其总计均数作出近似的区间估计。上式对其总计均数作出近似的区间估计。2. t分布法(分布法(未知)未知)根据根据t分布原理,分布原理,P(-t /2, t t /2, )=1- 0/2/21-t/2t/2总体均数(总体均数(1-1- )可信区间计算公式如下:)可信区间计算公式如下: 对于例对于例5-2,因为总体标准差未知,所以采用,因为总体标准差未知,所以采用公式公式(5-6)计算总体均数的计算总体均数的95%置信区间为:置信区间为: 48.651.9841.523=48.653.02 =(45.63,51.67)kg 95可信

9、区间可信区间 可可以以认认为为是是每每抽抽100个个由由样样本本含含量量相相等等的的样样本本算算得得的的置置信信区区间间,平平均均有有95个个置置信信区区间间会会包包括括总总体体均均数,只有数,只有5个置信区间不会包括总体均数。个置信区间不会包括总体均数。置信区间的涵义置信区间的涵义(1)置置信信区区间间 包包括括总总体体均均数的可能性为数的可能性为95; (2)总体均数落在置信区间总体均数落在置信区间 范围内的可能性为范围内的可能性为95; (3)通通过过样样本本资资料料计计算算出出的的95置置信信区区间间19.623.2kg包括总体均数的可能性为包括总体均数的可能性为95。判断:判断:置信

10、区间的两个要素:置信区间的两个要素:1.准确度准确度2.精密度精密度反映在可信度反映在可信度1- 的大小上,从准确度的角度,的大小上,从准确度的角度,愈接近愈接近1越好,如越好,如99%可信区间比可信区间比95%的好;的好; 它反映在区间的宽度上,即区间越窄越好它反映在区间的宽度上,即区间越窄越好 均数可信区间与参考值范围的区别均数可信区间与参考值范围的区别1.含义:含义:均数可信区间用于估计总体参数,而参考均数可信区间用于估计总体参数,而参考值范围用于估计变量值的分布范围。值范围用于估计变量值的分布范围。2.计算公式:计算公式:均数可信区间的计算公式是基于统计量的均数可信区间的计算公式是基于

11、统计量的抽样分布,而参考值范围的计算基于变量抽样分布,而参考值范围的计算基于变量值的分布。值的分布。 Bernoulli试验试验以以A表示所感兴趣的事件,表示所感兴趣的事件,A事件发事件发生称为生称为“成功成功”,不发生称为,不发生称为“失失败败”。相应的这类试验称作为。相应的这类试验称作为“成成败型败型”试验或试验或Bernoulli试验。试验。一、一、 二项分布二项分布第四节第四节 二项分布和二项分布和Poisson分布分布 必须满足下列三条件必须满足下列三条件:(1)每次试验结果只能是两个互斥结果之)每次试验结果只能是两个互斥结果之 一(一(A或非或非A)。)。(2)每次试验的条件不变,

12、每次试验结果)每次试验的条件不变,每次试验结果 A事件发生的概率为常数事件发生的概率为常数 。(3)各次试验独立,即每次试验出现事件)各次试验独立,即每次试验出现事件 A的概率与前面各次试验出现的结果无关。的概率与前面各次试验出现的结果无关。 概率的运算法则概率的运算法则 乘法法则乘法法则:几个相互独立事件的乘积(同时发生)几个相互独立事件的乘积(同时发生)的概率等于各独立事件概率之积:的概率等于各独立事件概率之积: P(A1A2An) = P(A1)P(A2) P(An )可加性:可加性:互不相容互不相容事件事件 A1、A2、An(任一次(任一次试验至多一个出现)试验至多一个出现)的和(至少

13、一个发生)的概的和(至少一个发生)的概率等于各事件发生的概率之和:率等于各事件发生的概率之和: P(A1+A2 +An ) = P(A1)+P(A2)+ +P(An )二项分布二项分布成功次数的概率分布成功次数的概率分布 某实验中小白鼠染毒后某实验中小白鼠染毒后死亡概率死亡概率: 为为0.7,则则生存概率生存概率为为: 1- =0.3,故对故对一只一只小白鼠进行实验的结果为:小白鼠进行实验的结果为: 死死(概率为(概率为 )或)或 生生(概率为(概率为1- ););对对二只二只小白鼠(甲乙)进行实验的结果为:小白鼠(甲乙)进行实验的结果为:甲乙均死甲乙均死概率为概率为 2甲死乙生甲死乙生概率为

14、概率为 (1- )乙死甲生乙死甲生概率为概率为(1- ) 甲乙均生甲乙均生概率为概率为(1- )2概率相加得概率相加得: 2+ (1- )+(1- ) +(1- )2= +(1- )2 对对三只三只小白鼠(甲乙丙)进行实验的小白鼠(甲乙丙)进行实验的结果结果为:为:表表 3只白鼠各种实验结果及其发生概率只白鼠各种实验结果及其发生概率概率相加得概率相加得: +(1- )3 对对n只只小白鼠进行实验,所有可能结果的概率相小白鼠进行实验,所有可能结果的概率相加得加得: n+Cn1 (1- )n-1+Cnx x(1- )n-x+(1- )n= +(1- )nn次试验中事件次试验中事件A出现的次数为出现

15、的次数为x的概率是:的概率是: ,k=0,1,2, n 记为记为 x B(n, )表表5-3 接种接种3 人可能出现不适反应的人数及其概率人可能出现不适反应的人数及其概率二项分布的性质:二项分布的性质:(1) 二项分布的概率之和等于二项分布的概率之和等于1,即,即(2)单侧累积概率单侧累积概率至少有至少有m例阳性的概率(上侧累积概率)例阳性的概率(上侧累积概率) 至多有至多有m例阳性的概率(下侧累积概率)例阳性的概率(下侧累积概率)(3) 二项分布的均数和标准差二项分布的均数和标准差若若xB(n, ),则则x 的总体均数的总体均数 = n ,x的总体方差的总体方差 2 n (1 )x的标准差的

16、标准差(4) 二项分布的正态近似性二项分布的正态近似性 二项分布图形的形状取决于二项分布图形的形状取决于 和和n 的大的大小;小;二项分布的图形有如下特征:二项分布的图形有如下特征:当当 =0.5时,无论时,无论n的大小,均为对的大小,均为对称分布;称分布;当当 0.5 , n较小时为偏态分布较小时为偏态分布, n较较大时逼近正态分布。大时逼近正态分布。n=5 =0.3n=10 =0.3n=20 =0.3当当 不接近于不接近于0或或1,n不是很小,不是很小,n 5且且n(1 ) 5时,二项分布近似正态分布,有时,二项分布近似正态分布,有因此因此,二项分布的正态近似拓宽了二项分布的二项分布的正态近似拓宽了二项分布的应用范围,应用十分方便。应用范围,应用十分方便。样本率样本率p的总体均数的总体均数: 当样本含量较大,总体阳性率当样本含量较大,总体阳性率 不接近与不接近与0 0,也不接近于也不接近于1 1时,样本中的阳性数近似正态分时,样本中的阳性数近似正态分布布N(nN(n , ), ),样本阳性率也近似正态样本阳性率也近似正态分布分布N(N( , , p p),),故有故有样本率样本率p

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号