第五讲2参数估计与假设检验

资源描述

《第五讲2参数估计与假设检验》由会员分享，可在线阅读，更多相关《第五讲2参数估计与假设检验（34页珍藏版）》请在金锄头文库上搜索。

1、均数估计与假设检验,姬亚芹,参数估计是指用样本指标值（统计量）推断总体指标值（参数）。点估计和区间估计。点估计就是用相应样本统计量直接作为其总体参数的估计值。如，区间估计就是按照预先给定的概率（1-）所确定的包含未知总体参数的一个范围。该范围称为参数的可信区间或置信区间(confidence interval, CI) 。,1、总体均数估计的含义,预先给定的概率(1)称为置信度，常取95%或99%。,置信区间通常由两个数值构成，称可信限(confidence limit, CL),(1，2)是参数的置信区间，是一个范围；为显著性水平，一般为5%；（1-）表明判断总体参数落在置信区间的可

2、信程度，由全部样本指标所确定的所有置信区间中平均有95%的估计区间包括了总体参数，另外有5%的区间没有包括总体参数。什么是置信度？什么是显著性水平？,在实际工作中，只能根据一次试验结果计算一个可信区间，就认为该区间包含了相应总体参数，该结论犯错误的概率。,可信区间一旦形成，它要么包含总体参数，要么不包含总体参数，二者必居其一，无概率可言。可信度是事前概率。,正确性：可信度1，即区间包含总体参数的理论概率大小，愈接近1愈好。精确性：区间的宽度，区间愈窄愈好。当样本含量为定值时，上述两者互相矛盾。若只顾提高可信度，则可信区间会变宽。,评价可信区间估计的优劣：,2、总体均数可信区间的计

3、算,2.1单一总体均值的区间估计（1）总体方差已知或方差未知，但n60,按u分布,表示区间以95%（a=0.05）的可靠性包含总体，实际均值不在该区间的可能性为0.05 a为风险系数,误差限,双侧-方差已知,单侧-方差已知,双侧-方差未知,单侧-方差未知,（2）总体方差未知且样本容量较小，按t分布,对于非正态总体，只要样本足够大，仍可按上式计算置信区间,单侧,双侧,2、总体均数可信区间的计算,例：某地抽取正常成年人200名，测得其血清胆固醇的均数为3.64mmol/L,标准差为1.20mmol/L，估计该地正常成年人血清胆固醇均数的95%可信区间。,N60，可采用正态近似的方法计算,2、总体

4、均数可信区间的计算,2.2 两总体均数之差的1可信区间,双侧,单侧,从总体标准差相等，总体均数不等的两个正态总体进行随机抽样，若两样本的样本含量、均数、标准差分别用表示，则两总体均数之差的双侧1-可信区间为,自由度v=（n1-1）+(n2-1)=n1+n2-2,两均数之差的标准误,2、总体均数可信区间的计算,3.参考值范围,参考值范围指正常值范围。由于存在个体差异，环境数据并非常在一定范围内波动，故采用环境参考值范围作为判定正常与异常的参考标准。通常采用双侧参考值范围制定下侧和上侧值。通常使用的环境参考值范围有90%，95%和99%，常用的是95%。有两种求参考值的方法。,3、参考值范

5、围,正态分布法进行正态分布检验样本量足够大，通常大于100 双侧，1-a参考值范围：单侧，1-a参考值范围：或通常选择为平均值加减2倍标准差范围为参考值范围,摘自，孙振球，医学统计学,3、参考值范围,偏态分布法样本量足够大，通常大于100 双侧，1-a参考值范围：单侧，1-a参考值范围：或,即P2.5-P97.5之间的值,3、可信区间与参考值范围的区别,可信区间用于估计总体参数，总体参数只有一个。参考值范围用于估计个体值的分布范围，个体值有很多。,95%可信区间中的95%是可信度，即所求可信区间包含总体参数的可信程度为95%。 95%参考值范围中的95%是一个比例，

6、即所求参考值范围包含了95%的正常值。,4.假设检验的基本概念,4.1假设检验（hypothesis testing）又称显著性检验。通常先对总体的参数或分布作出某种假设，然后用适当的方法根据样本对总体提供的信息，推断此假设应当被拒绝或接受。经常被用来比较不同处理所产生的效应之间的差别是否具有统计学意义。,4.2无效假设和备择假设（1）无效假设又称零假设，根据检验结果准备予以拒绝或接受的假设,记为H0（null hypothesis）；（2）备择假设又称对立假设，与原假设不相容，记为H1（alternative hypothesis）。如：对总体随机变量X的均值不小于一给定值0的假

7、设的检验公式为： H0：0, H1: 0 注意：H0和H1相互联系，相互对立，缺一不可， H0与H1的内容不能互换，结论根据H0和H1作出。,4.假设检验的基本概念,4.假设检验的基本概念,4.3参数检验和非参数检验检验统计量的分布函数依赖于观测值的分布函数的类型，称为参数检验。反之称非参数检验。,参数检验：正态分布和方差齐性。非参数检验：不满足。一元分析的参数法有：u检验，t检验，方差分析，一元分析的非参数方法有：符号检验，符号秩检验，Wilcoxon秩和检验，Manny-Whitney检验，Kruskal-Wallis检验，Friedman检验。,4.假设检验的基本概念,4.4拒

8、绝域所使用的统计量可能取值的集合的某个子集合。如果根据观测值得出的统计量的数值属于这个集合，拒绝原假设，否则接受原假设。双尾检验时，拒绝域的两侧边界是检验统计量的临界值。,4.假设检验的基本概念,1.5检验水准称显著性水准，是预先规定的概率值，它确定了小概率事件的标准。当原假设正确时，检验水平是检验统计量落入拒绝域的概率，而被拒绝的概率的最大值，记为。也就是一旦检验水平，就拒绝原假设。常取 = 0.05或0.01。可根据不同研究目的给予不同设置。,4.假设检验的基本概念,1.6单侧检验、双侧检验和临界值单侧检验：检验统计量是一维的，拒绝域是小于（或大于）某给定数的所有数值的集合。若

9、从专业上看一种方法结果不可能低于或高于另一种方法结果，此时应该用单侧检验。如静电除尘效率高于布袋除尘效率。H1只含有大于号或小于号，采用单侧检验。双侧检验：检验统计量是一维的，拒绝域是小于第一个给定数而大于第二个给定数的所有数值的集合。H1同时含有大于号和小于号，采用双侧检验。如H1为12，则H0为12或12。双侧检验较保守和稳妥，一般采用。临界值：作为上述拒绝域界限的给定数。,5.假设检验的基本思想,反证法根据研究目的建立假设H0，先假设H0是正确的，再分析样本提供的信息是否支持H0，即在H0成立的条件下计算检验统计量，查表获得相应P值。如果H1成立，P值就小。当P小于或等于预先给定的

10、概率0.05，则为小概率事件。小概率事件在一次抽样中发生的可能性很小，如果它发生了，则有理由怀疑原假设可能不成立，认为它的对立面成立。所以，查表得到的P值小于0.05，则H1成立。小概率事件原理小概率事件(P0.05)在一次抽样中发生的可能性很小，如果它发生了，则有理由怀疑H0的正确性，认为H1成立。,例，通过以往大规模调查，已知某地一般新生儿的头围均数为34.50cm，标准差为1.99cm。为研究某矿区新生儿的发育状况，现从该地某矿区随机抽取新生儿55人，测得其头围均数为33.89cm，问该矿区新生儿的头围总体均数与一般新生儿头围总体均数是否不同？,6.1建立检验假设，确立检验方法假设

11、样本来自某一特定总体,无效假设和备择假设。据资料类型，确定要使用的检验方法。H0:=34.50,H1:34.50,6.假设检验的基本步骤,6.2单双侧检验的确定根据专业知识和所要解决的问题。通常选择双侧检验。,6.3确立检验水准根据需要，确定 =0.05或0.01。此处为0.05.,6.4计算检验统计量,根据变量和资料类型、设计方案、统计推断的目的、是否满足特定条件等（如数据的分布类型）选择相应的检验统计量。计算样本与总体的偏离程度. 所有检验统计量都是在H0成立条件下计算来的。有的检验不需要计算统计量，而直接计算P值。,为单样本t检验,6.5 计算与统计量对应的P值，做出推断 P值是决

12、策的依据。 P值的定义：在零假设成立的条件下，出现统计量目前值及更不利于零假设数值的概率。根据计算得到的统计量，查临界值表即可得到相应的P概率值。本例：V=54,查t临界值表，得到0.005P0.01，得到P0.05, 根据获得的事后概率P，与事先规定的概率检验水准进行比较，看其是否为小概率事件而得出结论。 P，按检验水准，拒绝H0，接受H1；P，按检验水准，不拒绝H0，无统计学意义(统计结论)，不拒绝H0不等于接受H0。按所取检验水准0.05, 则拒绝H0，接受H1，差异有统计学意义（统计结论），可以认为矿区新生儿的头围均数与一般新生儿不同，矿区新生儿的头围小于一般新生儿。,6.假设检

13、验的基本步骤,若，不拒绝H0，但不能下“无差别”或“相等”的结论，只能下“根据目前试验结果，尚不能认为有差别”的结论。,7. I型错误和II型错误-补充,可能发生的两类错误,大，小；大，小。增加n可同时缩小，。,可取单尾亦可取双尾。 II型错误的概率大小用表示, 只取单尾，值的大小一般未知，须在知道两总体差值 (如12等)、及n 时，才能算出。 1称检验效能(power of a test)，过去称把握度。为当两总体确有差异，按检验水准所能发现该差异的能力。1只取单尾。拒绝H0，只可能犯I型错误，不可能犯II型错误；不拒绝H0，只可能犯II型错误，不可能犯I型错误。,8、假设检验

14、应注意的问题,1.要有严密的研究设计组间应均衡，具有可比性，除对比的主要因素(如临床试验用新药和对照药)外，其它可能影响结果的因素(如年龄、性别、病程、病情轻重等)在对比组间应相同或相近。,配对设计计量资料：配对t检验。完全随机设计两样本计量资料：小样本(任一ni60)且方差齐: 两样本t检验方差不齐: 近似t检验大样本(所有ni60): u检验。,2.不同资料应选用不同检验方法,8、假设检验应注意的问题,3.正确理解“significance”一词的含义过去称差别有或无“显著性”，易造成两样本统计量之间比较相差很大的误解。现在称差别有或无“统计学意义”，相应推断为：可以认为

15、或还不能认为两个或多个总体参数有差别。,8、假设检验应注意的问题,4.结论不能绝对化因统计结论具有概率性质，故“肯定”、 “一定”、“必定”等词不要使用。在报告结论时，最好列出检验统计量的值，尽量写出具体P值，而不简单写成 P0.05，以便读者与同类研究进行比较。,8、假设检验应注意的问题,斜体,5.统计“有意义”与专业“有意义” 统计“有意义”对应统计结论，专业“有意义”对应专业结论。统计结论有意义，专业结论无意义，最终结论没有意义，样本含量过大或设计存在问题。统计结论无意义，专业结论有意义，检查设计是否合理、样本含量是否足够。,8、假设检验应注意的问题,6.可信区间与

16、假设检验区别和联系,可信区间可回答假设检验问题 H0: =0=140g/L 铅作业男性工人的平均血红蛋白含量与正常成年男性的相等 H1: 0 =0.05 铅作业男性工人平均血红蛋白含量总体均数的95%置信区间为(122.12，139.54) g/L，未包括0=140g/L 按=0.05水准，拒绝H0 ，接受H1。,8、假设检验应注意的问题,可信区间说明量的大小即推断总体均数所在范围，假设检验推断质的不同即判断两总体均数是否不等。可信区间不但能回答差别有无统计学意义，还能提示差别有无实际专业意义。可信区间不能够完全代替假设检验。可信区间只能在预先规定概率的前提下进行计算，而假设检验能获得一较为确切的P值。,8、假设检验应注意的问题,

展开阅读全文