假设检验的基本概念

上传人:鲁** 文档编号:584152182 上传时间:2024-08-30 格式:PPT 页数:36 大小:249.53KB
返回 下载 相关 举报
假设检验的基本概念_第1页
第1页 / 共36页
假设检验的基本概念_第2页
第2页 / 共36页
假设检验的基本概念_第3页
第3页 / 共36页
假设检验的基本概念_第4页
第4页 / 共36页
假设检验的基本概念_第5页
第5页 / 共36页
点击查看更多>>
资源描述

《假设检验的基本概念》由会员分享,可在线阅读,更多相关《假设检验的基本概念(36页珍藏版)》请在金锄头文库上搜索。

1、假设检验的基本概念假设检验的基本概念统计分析统计分析统计描述统计描述统计推断统计推断参数估计参数估计假设检验假设检验(hypothesis test)(significance test)例例8-1 : 通过以往大规模调查,某地新生通过以往大规模调查,某地新生儿头围均数为儿头围均数为34.50cm,标准差为,标准差为1.99cm,为研究某矿区新生儿发育状况,为研究某矿区新生儿发育状况,现从该矿区随机抽取新生儿现从该矿区随机抽取新生儿55人,得头人,得头围均数为围均数为33.89cm,问该矿区新生儿总,问该矿区新生儿总体均数与一般新生儿头围总体均数是否体均数与一般新生儿头围总体均数是否不同不同

2、。差异来源差异来源导致矿区新生儿头围均数与该地新生儿导致矿区新生儿头围均数与该地新生儿头围均数不等的原因头围均数不等的原因?由于抽样误差导致由于抽样误差导致?矿区的地理环境及生活条件等因素对新矿区的地理环境及生活条件等因素对新生儿头围的影响生儿头围的影响两种可能性都可能发生,如何抉择?两种可能性都可能发生,如何抉择?两个假设两个假设H0:该矿区新生儿总体均数:该矿区新生儿总体均数()与一般与一般新生儿头围总体均数新生儿头围总体均数(0)相同相同H1:该矿区新生儿总体均数与一般新生:该矿区新生儿总体均数与一般新生儿头围总体均数不同儿头围总体均数不同可考虑样本资料和哪一个假设有较大的可考虑样本资料

3、和哪一个假设有较大的矛盾来决定拒绝哪一个假设。一般考察矛盾来决定拒绝哪一个假设。一般考察样本资料是否与样本资料是否与H0有较大的矛盾。有较大的矛盾。 H0成立时会怎样?成立时会怎样?根据样本均数抽样根据样本均数抽样分布知识得分布知识得 N(0 , 02/n)。 所得所得u值因样本而异,但其绝对值多数值因样本而异,但其绝对值多数情况下落在情况下落在0附近。附近。u的分布规律可由的分布规律可由u界值表查出。界值表查出。当前状况如何,发生的可能性(当前状况如何,发生的可能性(P值)值)有多大?有多大? 本例本例n =55, =33.89, 0 =34.50 0=1.99 , 得得u =-2.273

4、P值值:指在:指在H0成立的假设前提下,出现当成立的假设前提下,出现当前检验统计量以及更极端情况的概率。前检验统计量以及更极端情况的概率。 查查u界值表,当前界值表,当前u值以外的双侧尾部面值以外的双侧尾部面积介于积介于0.05和和0.02之间,即之间,即0.05P0.02决策决策 决策者需要事先规定一个可以忽略决策者需要事先规定一个可以忽略的小概率值的小概率值。如取如取0.05,那么上述,那么上述P值值可认为很小。即可认为很小。即H0成立时,几乎不可能成立时,几乎不可能出现当前的状况。出现当前的状况。于是,面临两种抉择,一是认为于是,面临两种抉择,一是认为H0是成是成立的,而当前的极端情况又

5、恰好偶然发立的,而当前的极端情况又恰好偶然发生了;二是怀疑生了;二是怀疑H0的正确性,从而接受的正确性,从而接受H1。根据小概率事件在一次抽样中不可。根据小概率事件在一次抽样中不可能发生的原理我们通常选择后者。本例,能发生的原理我们通常选择后者。本例,可以认为该矿区新生儿总体均数与一般可以认为该矿区新生儿总体均数与一般新生儿头围总体均数不同新生儿头围总体均数不同 。当然,此时决策者也可能错误地拒绝当然,此时决策者也可能错误地拒绝H0,其犯错的最大概率为,其犯错的最大概率为。假设检验的基本步骤假设检验的基本步骤1.建立假设、确定检验水准建立假设、确定检验水准 H0:=0 (检(检验假设验假设 h

6、ypothesis to be tested) (无效(无效假设假设 null hypothesis ) H1:0 (备(备择假设择假设 alternative hypothesis ) 显著性水平:显著性水平:=0.052.选用适当的检验方法并计算相应的选用适当的检验方法并计算相应的检验统计量检验统计量根据研究分析目的要求、设计方法、资根据研究分析目的要求、设计方法、资料类型和各假设检验方法的应用条件料类型和各假设检验方法的应用条件 检验统计量属于样本指标,是检验统计量属于样本指标,是根据现有根据现有样本,在样本,在H0成立的假设前提下成立的假设前提下,选用不,选用不同公式计算出来的同公式计

7、算出来的不同的检验方法要计算其相应的统计量,不同的检验方法要计算其相应的统计量,它们各自服从特定的概率分布它们各自服从特定的概率分布3.确定确定P值并作出推断结论值并作出推断结论P值系指在值系指在H0成立的假设前提下,出现当成立的假设前提下,出现当前检验统计量以及更极端情况的概率。前检验统计量以及更极端情况的概率。若检验结果是若检验结果是P ,下差别有统计意义,下差别有统计意义的结论。的结论。依据是依据是:在:在H0成立的条件下,成立的条件下,得到当前结果(遇到当前情形)的概率得到当前结果(遇到当前情形)的概率小于小于,而小概率事件一般不可能在一次,而小概率事件一般不可能在一次试验中发生,但现

8、在却发生了,所以怀试验中发生,但现在却发生了,所以怀疑疑H0的正确性,于是决定拒绝的正确性,于是决定拒绝H0,接受,接受H1。 此时,我们犯错误的概率最大仅为此时,我们犯错误的概率最大仅为。相反如相反如P ,即在即在H0成立时,发生当前成立时,发生当前事件的概率很大,或说现有样本信息支事件的概率很大,或说现有样本信息支持持H0,尚没有理由拒绝它(尽管尚没有理由拒绝它(尽管 0 , )。)。不管是拒绝还是不拒绝不管是拒绝还是不拒绝H0,都有可能发都有可能发生错误。生错误。结论一般包含统计结论和专业结论。结论一般包含统计结论和专业结论。大样本均数的假设检验大样本均数的假设检验v单样本均数的单样本均

9、数的u检验检验例例8-2:1995年,某地年,某地20岁应征男青年岁应征男青年平均身高为平均身高为168.5cm。2003年在当地年在当地20岁应征男青年中随机抽取岁应征男青年中随机抽取85人,平均身人,平均身高为高为171.2cm,标准差为标准差为5.3cm,问这两问这两年身高是否不同。年身高是否不同。解:解:总体方差一般未知,当样本含量足总体方差一般未知,当样本含量足够大时,用够大时,用S作为作为 的估计值。的估计值。1.建立假设,确定检验水准建立假设,确定检验水准 H0: 168.5, H1: 168.5 0.052.计算统计量计算统计量u3.确定确定P值,下结论值,下结论 查查u界值表

10、,界值表, 4.70 u 0.001/2=3.2905,得得P u 0.001/2=3.2905,得得P 0.001,按照按照 =0.05水准,拒绝水准,拒绝H0,接受接受H1,可认为试验组和对照组退热天数的总体均可认为试验组和对照组退热天数的总体均数不等,疗效不同。试验组比对照组平均退数不等,疗效不同。试验组比对照组平均退热天数短。热天数短。 1 1- -2 2 的的95可信区间为可信区间为-3.3 -1.3天天大样本率的假设检验大样本率的假设检验当当n足够大,且样本率足够大,且样本率p和和(1-p)均不太小,均不太小,如:如:np与与n(1-p)均大于均大于5时,样本率逼近时,样本率逼近正

11、态分布,此时率的假设检验可采用正态分布,此时率的假设检验可采用u检验,其具体条件如下。检验,其具体条件如下。1.n较大,如每组例数大于较大,如每组例数大于60;2.样本率样本率p或或(1-p)均不接近均不接近100%和和0;3.np与与n(1-p)均大于均大于5v单样本率的单样本率的u检验检验例例8-4:已知道某地已知道某地40岁以上成年男性岁以上成年男性高血压患病率为高血压患病率为8.5%(0),经健康教育经健康教育数年后,随机抽取该地成年男性数年后,随机抽取该地成年男性1000名,名,查出高血压患者查出高血压患者55例,患病率例,患病率(p)为为5.5%。问经健康教育后,该地成年男。问经健

12、康教育后,该地成年男性高血压患病率是否有降低?性高血压患病率是否有降低?解:解:从专业上可以确认经健康教育后该从专业上可以确认经健康教育后该地成年男性高血压患病率不可能低于健地成年男性高血压患病率不可能低于健康教育前,故采用单侧检验。康教育前,故采用单侧检验。1.建立假设,确定检验水准建立假设,确定检验水准 H0: =8.5% ,H1: u0.01 ,故,故P0.01,按,按 =0.05水准拒绝水准拒绝H0 ,接受接受H1,差异有统计学意义,可以认为经健差异有统计学意义,可以认为经健康教育后,该地成年男性高血压患病率康教育后,该地成年男性高血压患病率有多降低有多降低 单样本率比较,当不满足正态

13、分布应用单样本率比较,当不满足正态分布应用条件时,可根据二项分布的原理直接计条件时,可根据二项分布的原理直接计算概率,算概率,无效假设成立时,阳性数为无效假设成立时,阳性数为X的概率:的概率:v两个率比较的两个率比较的u检验检验例例8-5:某医院用黄芪注射液和胎盘球蛋某医院用黄芪注射液和胎盘球蛋白进行穴位注射治疗小儿支气管哮喘病白进行穴位注射治疗小儿支气管哮喘病人,黄芪注射液治疗人,黄芪注射液治疗117例,有效例,有效103例;例;胎盘球蛋白治疗胎盘球蛋白治疗55例,有效例,有效49例。试比例。试比较两种疗法有效率差异有无统计学意义。较两种疗法有效率差异有无统计学意义。解:解:基本原理与两样本

14、均数基本原理与两样本均数u检验类同,检验类同,在在H0 成立和大样本条件下,两样本率差成立和大样本条件下,两样本率差值值(p1-p2)近似服从均数为近似服从均数为1- 2=0,方差方差为为 的正态分布。的正态分布。1.建立假设,确定检验水准建立假设,确定检验水准 H0: 1= 2 ,H1: 1 2 =0.052.计算统计量计算统计量u3.确定确定P值,做出结论值,做出结论 u0.05/2 = 1.96,现现 |u| 0.05,按,按 = 0.05检验水准接受检验水准接受H0 ,差异无统计学意义,差异无统计学意义,尚不能认为两种疗法治疗小儿支气管哮喘的尚不能认为两种疗法治疗小儿支气管哮喘的疗效有

15、差别。疗效有差别。两样本率比较及多个样本率比较,当两样本率比较及多个样本率比较,当不满足正态分布应用条件时,可采用不满足正态分布应用条件时,可采用 2检验或检验或Fisher精确概率法,详见后精确概率法,详见后面的面的 2检验章节。检验章节。客观实际客观实际 拒绝拒绝H0 不拒绝不拒绝H0 H0成立成立 类错误类错误( ) 正确正确(1-) H1成立成立 正确正确(1-) 类错误类错误( )两类错误两类错误 类错误类错误(type error):拒绝了实际上是拒绝了实际上是成立的成立的H0 接受接受H1(弃真弃真),亦称假阳性错,亦称假阳性错误。误。 类错误类错误(type error):不拒

16、绝实际上不拒绝实际上是不成立的是不成立的H0 (存伪),亦称假阴性错存伪),亦称假阴性错误。误。例:例:为考察某种降血脂新药的疗效,随机抽取为考察某种降血脂新药的疗效,随机抽取n个人接受该药治疗,经过一个疗程,得各人血脂个人接受该药治疗,经过一个疗程,得各人血脂下降值。已知常规药治疗的平均血脂下降量为下降值。已知常规药治疗的平均血脂下降量为0,问该药是否优于常规药?问该药是否优于常规药? H0: =0,H1: 0 ( 0) 类错误类错误把与常规药本无差别的药说成优于常规药。把与常规药本无差别的药说成优于常规药。 类错误类错误把优于常规药的新药说成与常规药相当。把优于常规药的新药说成与常规药相当

17、。当当n确定时,确定时,越大,越大, 越小;越小;要同时减小要同时减小和和,可以增大可以增大n。检验效能检验效能(power of test,把握度把握度1- ):即即两总体确有差别时,按两总体确有差别时,按水准能发现它水准能发现它们有差别的能力。们有差别的能力。一般未知,即不知道犯第二类错误的一般未知,即不知道犯第二类错误的概率。概率。在估计样本容量时非常重要。在估计样本容量时非常重要。单双侧检验单双侧检验如例如例8-2,如果有理由认为,如果有理由认为(参考文献,专业背参考文献,专业背景)景)2003年应征男青年得平均身高不会小于年应征男青年得平均身高不会小于1995年,则可用单侧检验年,则

18、可用单侧检验 H0:=0 168. 5, H1: 0168.5 =0.05(单侧)单侧) u4.70 u0.00053.2905, P 0.0005 , 按检验水准按检验水准=0.05=0.05,拒绝拒绝H0 ,接受接受H1,二者差别有统计学意义二者差别有统计学意义标准正态分布单双侧界值标准正态分布单双侧界值单侧检验更容易得出有差别的结论(容单侧检验更容易得出有差别的结论(容易犯易犯类错误),应用时要有过硬的专业类错误),应用时要有过硬的专业依据,发表论文时要特别注明。依据,发表论文时要特别注明。假设检验应注意的问题假设检验应注意的问题实验设计方面实验设计方面 随机抽样、分组,资料具有均衡性和

19、可比性随机抽样、分组,资料具有均衡性和可比性结论的正确性是以概率作为保证的,推断结论结论的正确性是以概率作为保证的,推断结论不能绝对化不能绝对化报告结论时应给出检验统计量,报告结论时应给出检验统计量,值,单侧检值,单侧检验应特别说明。拒绝验应特别说明。拒绝H0,接受接受H1时,要结合样时,要结合样本均数说明其大小。假设检验与可信区间结合本均数说明其大小。假设检验与可信区间结合起来,同时给出起来,同时给出P值和可信区间值和可信区间正确理解差别有统计学意义的涵义。当专业上正确理解差别有统计学意义的涵义。当专业上和统计学上都有和统计学上都有“显著性意义显著性意义”时,才有实用价时,才有实用价值值P

20、值值v指在指在H0成立的假设前提下,出现当前检成立的假设前提下,出现当前检验统计量以及更极端情况的概率验统计量以及更极端情况的概率v检验后才能确定检验后才能确定v只针对某个样本而言,不同的样本可能只针对某个样本而言,不同的样本可能有不同的有不同的P 值值 vP值越小,当前实验结果越值越小,当前实验结果越“不利于不利于”接接受受H0,不能说明总体参数间的差别越大,不能说明总体参数间的差别越大,只能据只能据P 值做出拒绝或接受值做出拒绝或接受H0的定性判的定性判断断显著性水平显著性水平v检验水准检验水准(size of a test)或显著性水平或显著性水平(significance level)v需要在检验前确定(常取需要在检验前确定(常取0.05,0.01)v表示拒绝了实际上成立的表示拒绝了实际上成立的H0的概率大小,的概率大小,也可表示在拒绝也可表示在拒绝H0做出做出“有差别有差别”结论时结论时可能犯错误的最大概率。可能犯错误的最大概率。小小 结结假设检验的基本思想与步骤假设检验的基本思想与步骤两类错误及其相互关系两类错误及其相互关系可信区间与假设检验可信区间与假设检验P 值与值与

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号