《3均数的抽样误差和总体均数估计ppt课件》由会员分享,可在线阅读,更多相关《3均数的抽样误差和总体均数估计ppt课件(47页珍藏版)》请在金锄头文库上搜索。
1、均数的抽样误差和总体均数估计均数的抽样误差和总体均数估计1.参数估计参数估计2. 包括:点估计与区间估计包括:点估计与区间估计3.2. 假设检验假设检验统计推断的两部分内容:统计推断的两部分内容:总体总体样本样本随机抽取部分观察单位随机抽取部分观察单位 ? 推断推断inferenceinference参数估计参数估计一、抽样误差与标准误一、抽样误差与标准误2009年某市年某市18岁男生身高岁男生身高N(167.7,5.32)的抽样示意图的抽样示意图将此100个样本均数看成新变量值,则这100个样本均数构成一新分布,绘制频数图从正态分布总体从正态分布总体N(167.7,5.32)随机抽样所得样本
2、均数分布随机抽样所得样本均数分布 ,各样本均数,各样本均数 未必等于总体均数;未必等于总体均数; 各样本均数间存在差异;各样本均数间存在差异; 样样本本均均数数的的分分布布为为中中间间多多,两两边边少少,左左右右基基本本对称。对称。 样样本本均均数数的的变变异异范范围围较较之之原原变变量量的的变变异异范范围围大大大缩小。大缩小。可可算算得得这这100100个个样样本本均均数数的的均均数数为为167.69cm167.69cm、标标准准差为差为1.69cm1.69cm。样本均数分布具有如下特点:1、抽样误差:、抽样误差: 由个体变异产生的、抽样造成的样由个体变异产生的、抽样造成的样本统计量与总体参
3、数的差别本统计量与总体参数的差别 缘由:缘由:1 1抽样抽样 2 2个体差异个体差异表表示示样样本本统统计计量量抽抽样样误误差差大大小小的的统统计计指标。指标。标标准准误误:说说明明抽抽样样误误差差的的大大小小,总总体体计算公式计算公式(7-27)2、标准误、标准误(standarderror,SE)本质:样本均数的标准差本质:样本均数的标准差若用样本标准差若用样本标准差s来估计来估计,(7-28)当样本例数当样本例数n一定时,标准误与标准差呈正比一定时,标准误与标准差呈正比当标准差一定时,标准误与样本含量当标准差一定时,标准误与样本含量n的平方的平方根呈反比。根呈反比。通过增加样本含量通过增
4、加样本含量n来降低抽样误差。来降低抽样误差。随随机机抽抽样样调调查查7岁岁男男孩孩120名名,的的身身高高均均数数为为120.88,标标准准差差为为5.23,则则其其标标准准误误是多少?是多少?例子例子:指标指标意义意义应用应用标准差标准差(s s)衡量变量值变异程度,衡量变量值变异程度,s s越大表示变量值变异程度越大表示变量值变异程度越大,越大,s s越小表示变量值越小表示变量值变异程度越小变异程度越小描述正态分布(近似正态描述正态分布(近似正态分布)资料的频数分布;分布)资料的频数分布;医学参考值范围的估计医学参考值范围的估计标准误标准误( )样本均数的变异程度,表样本均数的变异程度,表
5、示抽样误差的大小。示抽样误差的大小。标准标准误越大表示抽样误差越大,误越大表示抽样误差越大,样本均数的可靠性越小;标样本均数的可靠性越小;标准误越小表示抽样误差越小,准误越小表示抽样误差越小,样本均数的可靠性越大样本均数的可靠性越大总体均数区间估计;两个总体均数区间估计;两个或多个总体均数间比较或多个总体均数间比较标准差和标准误的区别标准差和标准误的区别二、二、t 分布分布(一(一t分布概念分布概念 随机变量随机变量X XN Nm m,s2s2)标准正态分布标准正态分布N N0 0,1212)z变换式中式中为自由度为自由度(degreeoffreedom,df)3实实际际工工作作中中,由由于于
6、未未知知,用用替代,那么替代,那么不不再再服服从从标标准准正正态态分分布布,而服从而服从t分布。分布。均数均数标准正态分布标准正态分布N N0 0,1212)Student tStudent t分布分布自由度:自由度:n-1n-1(二(二t t 分布的图形与特征分布的图形与特征 分布只有一个参数,即自由度图图不同自由度下的不同自由度下的t分布图分布图1特征:特征:2、t界值表:界值表:详详见见附附表表2,可可反反映映t分分布布曲曲线线下下的的面面积。积。单侧概率或单尾概率:用单侧概率或单尾概率:用表示;表示;双侧概率或双尾概率:用双侧概率或双尾概率:用表示。表示。-tt0举例:举例:三、参数估
7、计三、参数估计用样本统计量推断总体参数。用样本统计量推断总体参数。总体均数估计:用样本均数和标总体均数估计:用样本均数和标准差推断总体均数。准差推断总体均数。1.点估计点估计(pointestimation):用相应样本统计量直接作为其总体参数用相应样本统计量直接作为其总体参数的估计值。如用的估计值。如用估计估计、s估计估计 等。其方等。其方法虽简单,但未考虑抽样误差的大小。法虽简单,但未考虑抽样误差的大小。按预先给定的概率(1)所确定的包含未知总体参数的一个范围。总体均数的区间估计:按预先给定的概率(1)所确定的包含未知总体均数的一个范围。如给定=0.05,该范围称为参数的95%可信区间或置
8、信区间;如给定=0.01,该范围称为参数的99%可信区间或置信区间。2区间估计区间估计(intervalestimation):计算总体均数可信区间计算总体均数可信区间需考虑:需考虑: (1总体标准差总体标准差 是否已知,是否已知, (2样本含量样本含量n的大小的大小通常有两类方法:通常有两类方法: (1t分布法分布法 (2z分布法分布法(1) 未知且未知且n比较小:按比较小:按t分布分布(2)按按z分布分布某地抽取正常成年人某地抽取正常成年人200名,测得其血清胆名,测得其血清胆固醇的均数为固醇的均数为3.64mmol/L,标准差为,标准差为1.20mmol/L,估计该地正常成年人血清胆固,
9、估计该地正常成年人血清胆固醇均数的醇均数的95%可信区间。可信区间。举例举例故该地正常成年人血清胆固醇均数的双侧95%可信区间为(3.47,3.81)mmolL。四、四、 假设检验的基本概念和步骤假设检验的基本概念和步骤例例 大规模调查表明,健康成年男子血红蛋白的大规模调查表明,健康成年男子血红蛋白的均数为均数为136.0g/L136.0g/L,今随机调查某单位食堂成年男性,今随机调查某单位食堂成年男性炊事员炊事员2525名,测得其血红蛋白均数名,测得其血红蛋白均数121g/L121g/L,标准差,标准差48.8g/L48.8g/L。 问题:根据资料推论食堂炊事员血红蛋白均数问题:根据资料推论
10、食堂炊事员血红蛋白均数是否与健康成年男子血红蛋白均数有无差别是否与健康成年男子血红蛋白均数有无差别(一)(一) 假设检验的基本思想假设检验的基本思想假假设检验目的目的判断差判断差别是由哪种原因造成的。是由哪种原因造成的。抽样误差造成的;抽样误差造成的;本质差异造成的。本质差异造成的。呵斥呵斥的可能原因有二:的可能原因有二:案例案例炊事员血红蛋白总体均数炊事员血红蛋白总体均数.0g/L121g/L炊事员血红蛋白总体均数炊事员血红蛋白总体均数 .0g/L .0g/L一种假设一种假设H0H0另一种假设另一种假设H1H1抽样误差抽样误差总体不同总体不同 假定假如炊事员均数为假定假如炊事员均数为136.
11、0g/L136.0g/L,即,即 那么那么 , ,服从服从t t 分布分布, ,绝大多数绝大多数t t应该分布在主要区域应该分布在主要区域 根据根据 t t 分布能够计算出有如此大差异的概率分布能够计算出有如此大差异的概率P P ,如果,如果P P 值很小,值很小,即计算出的即计算出的t t 值超出了给定的界限,则倾向于拒绝值超出了给定的界限,则倾向于拒绝H0H0,认为山区血红,认为山区血红蛋白均数不是蛋白均数不是136.0g/L136.0g/L 假设检验的基本思想假设检验的基本思想利用小概率反证法的思想利用小概率反证法的思想利用小概率反证法思想,从问题的对立面H0出发间接判断要解决的问题H1
12、是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。当P小于或等于预先规定的概率值,就是小概率事件。根据小概率事件的原理:小概率事件在一次抽样中发生的可能性很小,如果他发生了,则有理由怀疑原假设H0,认为其对立面H1成立1.建立检验假设,确定检验水准选用单侧或双侧检验)(1无效假设,记为H0;(2备择假设,记为H1。对于检验假设,须注意:1检验假设是针对总体而言,而不是针对样本;2H0和H1是相互联系,对立的假设,后面的结论是根据H0和H1作出的,因此两者不是可有可无,而是缺一不可二、假设检验的基本步骤二、假设检验的基本步骤3H1的内容直接反映了检验单双侧。若H1中只是0或只是
13、0,则此检验为单侧检验。它不仅考虑有无差异,而且还考虑差异的方向。4单双侧检验的确定,首先根据专业知识,其次根据所要解决的问题来确定。若从专业上看一种方法结果不可能低于或高于另一种方法结果,此时应该用单侧检验。一般认为双侧检验较保守和稳妥。 (3) 检检验验水水准准 ,是是预预先先规规定定的的概概率率值值,它它确确定定了了小小概概率率事事件件的的标标准准。在在实实际际工工作作中中常常取取 = 0.05。可根据不同研究目的给予不同设置。可根据不同研究目的给予不同设置。例如本题:例如本题: = 0.052.计算检验统计量根据变量和资料类型、设计方案、统计推断的目的、是否满足特定条件等如数据的分布类
14、型选择相应的检验统计量。如t检验、z检验、F检验和检验等。本例采用t检验方法本例t值为1.54 是是指指根根据据所所计计算算的的检检验验统统计计量量确确定定H0成成立立的的可可能能性性大大小小,即即确确定定在在检检验验假假设设条条件件下下由抽样误差引起差别的概率。由抽样误差引起差别的概率。 3.确定P值,做出推断结论 查查表表得得到到检检验验用用的的临临界界值值,然然后后将将算算得得的的统统计计量量与与拒拒绝绝域域的的临临界界值值作作比比较较,确确定定P 值值。如如对对双双侧侧 t 检检验验 ,那那么么 ,按检验水准按检验水准 拒绝拒绝H0。 本例查t界值表自由度v=24,t=1.54按照a=0.05的水准,不拒绝H0,差异没有统计学意义,还不能认为炊事员血红蛋白和健康成年男子有差别。谢谢 谢!谢!