第七章假设检验－金锄头文库

资源描述

《第七章假设检验》由会员分享，可在线阅读，更多相关《第七章假设检验（87页珍藏版）》请在金锄头文库上搜索。

1、第七章假设检验假设检验宋沈超假设检验在统计方法中的地位参数估计和假设检验参数估计和假设检验参数估计和假设检验是统计推断的两个组成部分，都是利用样本对总体进行某种推断，但推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的方法。假设检验讨论的是用样本信息去检验对总体参数的某种假设是否成立的程序和方法。教学内容第一节假设检验基本思想第二节假设检验基本步骤第三节 I型错误与II型错误第四节单侧检验与双侧检验第五节假设检验需要注意的问题第六节假设检验与区间估计的联系教学目标掌握：假设检验的基本思想和基本步骤，掌握并理解I型错误与II型错误、检验效能的概念熟悉：假设检验需要注意的问题，

2、单侧检验与双侧检验的概念和正确选择；理解假设检验与区间估计的联系。第一节假设检验基本思想一、假设检验问题的提出例例1 已知一个暗箱中有已知一个暗箱中有100个白色与黑色个白色与黑色球，不知各有多少个球，不知各有多少个。现有人猜测其中有现有人猜测其中有95个白色球，是否能相信他的猜测呢？个白色球，是否能相信他的猜测呢？他相当于提出假设他相当于提出假设： p=P(A)=0.05，A=任取一球是黑球任取一球是黑球. 可有两种解释：可有两种解释：现随机现随机从中抽出一个球从中抽出一个球, 发现是黑球发现是黑球, 怎样怎样解释这一事实？解释这一事实？ 1）他的猜测是正确的他的猜测是正确的, ,

3、恰抽得黑球是随机性恰抽得黑球是随机性所致；所致；2）他的猜测错了他的猜测错了. .应接受哪一种呢？应接受哪一种呢？根据根据小概率事件原理小概率事件原理, , 事件事件A（黑球）（黑球）的发的发生不能不使人们怀疑他的猜测生不能不使人们怀疑他的猜测, ,更更倾向于倾向于认为箱认为箱中白球个数不是中白球个数不是95个个. . 例2 某医院用新药与常规药物治疗婴幼儿贫血，将20名贫血患儿随机等分两组，分别接受两种药物治疗，测得血红蛋白增加量（g/L）见表7-1。问新药与常规药的疗效有无差别？表7-1 两种药物治疗婴幼儿贫血结果治疗药物血红蛋白增加量（g/L）新药组24 36 25 14 26 3

4、4 23 20 15 19常规药组14 18 20 15 22 24 21 25 27 23 由于事先对两种药品疗效（总体）情况一无所知，目前所关心的问题是如何根据两组样本患者治疗后血红蛋白增加量推断两种药品的疗效有无差异。可假设两组患者（总体）治疗后血红蛋白平均增加量无差异，即假设然后，利用两组样本患者治疗后血红蛋白平均增加量来检验这一假设是否正确。例3：根据1989年的统计资料，某地女性新生儿的平均体重为3190克。1990年从该地女性新生儿中随机抽取30人，测得其平均体重为3210克。从样本数据看，1990年女新生儿体重比1989年略高。究竟是否存在显著差异？差异产生的两种可能（假设）

5、：随机误差导致的差异：生活水平提高使孕妇营养状况改善导致新生儿体重实质性增加：利用样本信息检验假设能否成立的过程称为假设检验。上述案例的共同特点是：样本统计量与总体参数之间，或不同组样本统计量之间出现差异，这就提出了需要解决的问题：差异产生的原因（假设）？由两种误差导致：由随机误差导致样本来自同一总体，非本质差异不是随机误差导致样本来自另一总体，本质差异用样本信息检验（推断）上述假设哪个正确？统统计计假假设设假设检验假设检验如何正确区分这两种误差，如何正确区分这两种误差，是解决问题的关键。是解决问题的关键。假设检验就是处理这一类假设检验就是处理这一类问题的一种科学方法问题的一种科学

6、方法它所根据的原理是它所根据的原理是小概率原理小概率原理。二、小概率原理假设检验所依据的基本原理是小概率原理。什么是小概率？q概率是01之间的一个数，因此小概率就是接近0的一个数，一般指概率在0.05以下的事件。q著名的英国统计家Ronald Fisher 把20分之1作为标准，也就是0.05，从此0.05或比0.05小的概率都被认为是小概率。Fisher没有任何深奥的理由解释他为什么选择0.05，只是说他忽然想起来的什么是小概率原理？小概率原理发生概率很小的随机事件（小概率事件）在一次实验中几乎是不可能发生的。在一次试验中小概率事件一旦发生，我们就有理由拒绝原假设。根据这一原理，可以先假设总

7、体参数的某项取值为真，也就是假设其发生的可能性很大，然后抽取一个样本进行观察，如果样本信息显示出现了与事先假设相反的结果且与原假设差别很大，则说明原来假定的小概率事件在一次实验中发生了，这是一个违背小概率原理的不合理现象，因此有理由怀疑和拒绝原假设；否则不能拒绝原假设。检验中使用的小概率由研究者在检验前事先确定。小概率原理举例：某工厂质检部门规定该厂产品次品率不超过4方能出厂。今从1000件产品中抽出10件，经检验有4件次品，问这批产品是否能出厂? 如果假设这批产品的次品率P4，则可计算事件“抽10件产品有4件次品”的出现概率为：可见，概率是相当小的，1万次实验中可能出现4次，然而概率如此小

8、的事件，在一次实验中居然发生了，这是不合理的，而不合理的根源在于假设这批产品次品率P4 ，因而认为假设次品率P4是不能成立的，故按质检部门的规定，这批产品不能出厂。又又例例某某医医生生测测量量了了36名名从从事事铅铅作作业业男男性性工工人人的的血血红红蛋蛋白白含含量量，算算得得其其均均数数为为130.83g/L，标标准准差差为为25.74g/L。问问从从事事铅铅作作业业工工人人的的血血红红蛋蛋白白是是否否不不同同于于正正常常成成年年男男性性平平均均值值140g/L？如如果果从从事事铅铅作作业业不不会会影影响响工工人人的的血血红红蛋蛋白白含含量量，则则说说明明样样本本均均数数130.83g/L

9、与与总总体体均均数数140g/L的的差差异异是是由由抽抽样样误误差差引引起起的的，即即 = 0=140g/L，铅铅作作业业男男性性工工人人的的平平均均血血红红蛋蛋白含量与正常成年男性的相等白含量与正常成年男性的相等。据此，可提出原假设：H0: = 0=140g/L若原假设成立，事件应该是一个小概率事件（发生的概率为）。现在 |2.138| t0.05/2,35=2.030 P 0.05 这说明小概率事件在一次试验中发生了，而这一事件的概率仅为0.05，即平均每20次试验才出现一次现在我们只作了一次试验，居然就发生了，因此我们有理由怀疑假设 “铅作业男性工人的平均血

10、红蛋白含量与正常成年男性的相等”的原假设，即可认为从事铅作业会影响工人的血红蛋白含量。三、假设检验的基本思想假设样本是从原总体中抽取的，在此假设下构造一个小概率事件。若假设成立，则小概率事件一般是不会发生的。但在一次抽样中，如果小概率事件居然就发生了，则有理由怀疑假设的正确性，此时拒绝接受这个假设；而一次抽样中小概率事件没有发生，则没有理由怀疑假设的正确性，于是接受这个假设，认为样本仍来源于原总体。假设检验的基本思想. . 因此我们拒绝因此我们拒绝因此我们拒绝因此我们拒绝假设假设假设假设 1 1 1 1 0 0= 50= 50. . 如果这是总如果这是总如果这是总如果这是总体的真实均值体的真实

11、均值体的真实均值体的真实均值样本均值样本均值样本均值样本均值 0 00 0 = 50 = 50抽样分布抽样分布抽样分布抽样分布H H H0 00这个值不像我这个值不像我这个值不像我这个值不像我们应该得到的们应该得到的们应该得到的们应该得到的样本均值样本均值样本均值样本均值 .2020总体总体总体总体假设检验的过程抽取随机样本抽取随机样本抽取随机样本抽取随机样本均值均值均值均值 X X = 20= 20我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁提出假设提出假设提出假设提出假设拒绝假设拒绝假设! 别无选择别无选择.作出决策作出决策作出决策作出决策通过上述实例可以看出，假设检验的

12、目的是推断样本统计量之差是由于总体参数存在差异造成的，抑或是由于抽样误差造成的。假设检验的基本思想是在总体参数相等这一假设成立的前提下，计算出现等于及大于（或等于及小于）现有样本统计量的可能性（P值）。如果P值很小，小于等于事先规定的一个界值（例如5%），结论就是拒绝假设“总体参数相等”，认为总体参数之间存在差异。如果P值大于事先规定的界值，就不能拒绝这个假设，尚不能认为总体参数之间存在差异。假设检验的两个特点：第一，假设检验采用逻辑上的反证法，即为了检验一个假设是否成立，首先假设它是真的，然后对样本进行观察，如果发现出现了不合理现象，则可以认为假设是不合理的，拒绝假设。否则可以认为假设是合理

13、的，接受假设。第二，第二，假设检验采用的反证法带有概率性质假设检验采用的反证法带有概率性质。所谓假设的不合理不是绝对的，而是基于实践所谓假设的不合理不是绝对的，而是基于实践中广泛采用的小概率事件几乎不可能发生的原中广泛采用的小概率事件几乎不可能发生的原则。至于事件的概率小到什么程度才算是小概则。至于事件的概率小到什么程度才算是小概率事件，并没有统一的界定标准，而是必须根率事件，并没有统一的界定标准，而是必须根据具体问题而定。据具体问题而定。如果一旦判断失误，错误地拒绝原假设会造如果一旦判断失误，错误地拒绝原假设会造成巨大损失，那么拒绝原假设的概率就应定的成巨大损失，那么拒绝原假设的概率就应定的

14、小一些；如果一旦判断失误，错误地接受原假小一些；如果一旦判断失误，错误地接受原假设会造成巨大损失，那么拒绝原假设的概率就设会造成巨大损失，那么拒绝原假设的概率就应定的大一些。应定的大一些。小概率通常用表示，又称为检验的显著性水平。通常取0.05或0.01，即把概率不超过0.05或0.01的事件当作小概率事件。第二节假设检验基本步骤提出（建立）检验假设确定适当的检验统计量规定显著性水平计算检验统计量的值确定P值，作出统计推断（决策）一、提出（建立）检验假设检验假设分为检验假设分为原假设原假设与与备择假设备择假设，是，是根据问题的需根据问题的需要提出的一对对立的假设要提出的一对对立的假设。

15、什么是原假设？什么是原假设？(null hypothesis)(null hypothesis)1.是待检验的假设，又称是待检验的假设，又称“ “零假设零假设” ”、“ “无效假设无效假设” ”、“ “无差异假设无差异假设” ”。2.是研是研究者想收集证据予以究者想收集证据予以反对反对的假设的假设3.3.总是有等号总是有等号 , , 或或 4.4.表示为表示为 H H0 0 H H0 0：某一数值某一数值指定为指定为 = = 号，即号，即或或例如例如, H, H0 0： 31903190（克）（克）什么是备择假设？什么是备择假设？(alternative hypothesis)(al

16、ternative hypothesis)1.与原假设与原假设H H0 0对立的假设，也称对立的假设，也称“ “研究假设研究假设” ”2.研究研究者想收集证据予以者想收集证据予以支持支持的假设，的假设，总是有不等总是有不等号号: : , , 或或；备择假设的方向与想要证明其正备择假设的方向与想要证明其正确性的方向一致确性的方向一致3.表示为表示为 H H1 1 H H1 1：某一数值，或某一数值，或某一数值某一数值例如例如, H, H0 0： =3910=3910( (克克) )，H H1 1： 3910( 3910(克克) )H0：= =0， H1： 0；H0：=0， H1： =1；

17、H0：0， H1： 0；一、提出（建立）检验假设提出（建立）检验假设原假设和备择假设的确定（1）对于总体均值是否等于某一确定值的原假设可以表示为： H0：（如H0： 3190克）其对应的备择假设则表示为： H1：（如H1： 3190克)（2）对于总体均值 X是否大于某一确定值 X0 的原假设可以表示为：H0： X X0 （如H0： X2000克）其对应的备择假设则表示为： H1： X X0 （如H1： X 2000克)（3）对于总体均值 X是否小于某一确定值 X0的原假设可以表示为：H0： X X0 （如H0： X 5）其对应的备择假设则表示为： H1： X X0 （如H1： X5）

18、注意：原假设总是有等号：或或。1.原假设和备择假设是一个完备事件组，而且相互对立在一项假设检验中，原假设和备择假设必有一个成立，而且只有一个成立2.先确定备择假设，再确定原假设 3.等号“=”总是放在原假设上 4.因研究目的不同，对同一问题可能提出不同的假设(也可能得出不同的结论)提出提出假设假设(结论与建议结论与建议) 什么检验统计量什么检验统计量(test statistic) ？1.1.根据样本观测结果计算得到的，并据以对原假设和备择假设作出假设检验统计推断的某个样本统计量，如，如Z Z值、值、t t值、值、F F值、值、 2 2值等。值等。2.2.选择统计量的方法与参数估计相同

19、，需考虑选择统计量的方法与参数估计相同，需考虑是大样本还是小样本是大样本还是小样本总体方差已知还是未知总体方差已知还是未知3.检验统计量的基本形式为检验统计量的基本形式为二、确定适当的检验统计量二、确定适当的检验统计量（选择合适的检验方法）（选择合适的检验方法）三、规定显著性水平 ( (significant levelsignificant level) ) 什么是显著性水平？什么是显著性水平？1.1.是一个概率值（小概率事件发生的概率值）是一个概率值（小概率事件发生的概率值）2.2.原假设为真时，拒绝原假设的概率原假设为真时，拒绝原假设的概率被称为抽样分布的拒绝域被称为抽样分布的拒绝域3.

20、3.表示为表示为 (alpha)(alpha)常用的常用的值有值有0.01, 0.05, 0.100.01, 0.05, 0.104.4.由研究者事先确定由研究者事先确定假设检验中的拒绝域和接受域假设检验中的拒绝域和接受域什么是拒绝域？(rejection region)能够拒绝原假设的检验统计量的所有可能取值范围区域大小由显著性水平决定什么是临界值？(critical value)根据给定的显著性水平确定的拒绝域的边界值。临界值将统计量的所有可能取值区间分为两个互不相交的部分，即原假设的拒绝域和接受域。常用的值有0.01, 0.05, 0.10查表得出相应的临界值z 或z /2 /2，

21、 t 或t /2 /2对于正态总体，总体均值的假设检验可有如下图示正态总体，总体均值假设检验图示：（1）双侧检验设H0： X X0 ， H1： X X0，有两个临界值，两个拒绝域，每个拒绝域的面积为/2。也称双尾检验。双侧检验示意图双侧检验示意图 X0双侧检验示意图（显著性水平与拒绝域）抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布HHH000值值值值值值临界值临界值临界值临界值临界值临界值临界值临界值临界值临界值临界值临界值 /2 /2 /2 /2/2 样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域

22、接受域接受域接受域接受域接受域接受域1 - 1 - 1 - 置信水平置信水平置信水平置信水平置信水平置信水平双侧检验示意图（显著性水平与拒绝域） H H0 0值值值值临界值临界值临界值临界值临界值临界值临界值临界值 /2 /2/2 样本统计量样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域接受域接受域接受域接受域抽样分布抽样分布抽样分布抽样分布1 - 1 - 置信水平置信水平置信水平置信水平观察到观察到观察到观察到的样本的样本的样本的样本统计量统计量统计量统计量双侧检验示意图（显著性水平与拒绝域） H H0 0值值值值临界值临界值临界值临界值临界值临界值临界值

23、临界值 /2 /2/2 样本统计量样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域接受域接受域接受域接受域抽样分布抽样分布抽样分布抽样分布1 - 1 - 置信水平置信水平置信水平置信水平观察到观察到观察到观察到的样本的样本的样本的样本统计量统计量统计量统计量双侧检验示意图（显著性水平与拒绝域） H H0 0值值值值临界值临界值临界值临界值临界值临界值临界值临界值 /2 /2/2 样本统计量样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域接受域接受域接受域接受域抽样分布抽样分布抽样分布抽样分布1 - 1 - 置信水平置信水平置信水平置

24、信水平观察到观察到观察到观察到的样本的样本的样本的样本统计量统计量统计量统计量（2）单侧检验有一个临界值，一个拒绝域，拒绝域的面积为。分为左侧检验和右侧检验两种情况。单侧检验示意图（显著性水平与拒绝域） H H0 0值值值值临界值临界值临界值临界值样本统计量样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域接受域接受域接受域接受域抽样分布抽样分布抽样分布抽样分布1 - 1 - 置信水平置信水平置信水平置信水平左侧检验设H0： X X0 ，H1： X X0；临界值和拒绝域均在左侧。也称下限检验。 X0左侧检验示意图（显著性水平与拒绝域） H HH0 00值值值值值值临界值临界值临界值临

25、界值临界值临界值样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域接受域接受域接受域接受域接受域接受域抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量左侧检验示意图（显著性水平与拒绝域） H HH0 00值值值值值值临界值临界值临界值临界值临界值临界值样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域接受域接受域接受域接

26、受域接受域接受域抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水平观察到观察到观察到观察到的样本的样本的样本的样本统计量统计量统计量统计量右侧检验设H0 ： X X0 ，H1： X X0；临界值和拒绝域均在右侧。也称上限检验。 X0右侧检验示意图（显著性水平与拒绝域） H HH0 00值值值值值值临界值临界值临界值临界值临界值临界值样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域接受域接受域接受域接受域接受域接受域抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置

27、信水平置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量右侧检验示意图（显著性水平与拒绝域） H HH0 00值值值值值值临界值临界值临界值临界值临界值临界值样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量接受域接受域接受域接受域接受域接受域抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水平拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域观察到观察到观察到观察到的样本的样本的样本的样本统计量统计量统计量统计量四、计算检验统计量根据选定的适宜检验方法，计算相应的检验统计量，

28、如Z值、t值等。五、确定P值，作出统计推断（决策）决策规则1.给定显著性水平，查表得出相应的临界值z 或z /2 /2， t 或 t /2 /22.将检验统计量的值与水平的临界值进行比较3.作出统计推断（决策）双侧检验：|统计量| 临界值，拒绝H0 左侧检验：统计量临界值，拒绝H0 右侧检验：统计量临界值，拒绝H0利用利用P P值进行决策值进行决策什么是P 值?(P-value)1.是一个概率值2.如果原假设为真，P-值是抽样分布中出现大于或小于样本统计量的概率左侧检验时，P-值为曲线上方小于等于检验统计量部分的面积右侧检验时，P-值为曲线上方大于等于检验统计量部分的面积3

29、.被称为观察到的(或实测的)显著性水平H0 能被拒绝的最小值双侧检验的P 值 / / 2 2 / / 2 2 Z Z拒绝拒绝拒绝拒绝拒绝拒绝拒绝拒绝H HH0 00值值值临界值临界值临界值计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量临界值临界值临界值1/2 1/2 1/2 P P P 值值值1/2 1/2 1/2 P P P 值值值左侧检验的P 值H HH0 00值值值值值值临界值临界值临界值临界值临界值临界值样本统计量样

30、本统计量样本统计量样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水平计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量P P P 值值值右侧检验的P 值H HH0 00值值值值值值临界值临界值临界值临界值临界值临界值拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水平置信水平置信水平计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样

31、本统计量计算出的样本统计量计算出的样本统计量P P P 值值值利用 P 值进行检验(决策准则)1.单侧检验若p-值 , ,不拒绝 H0若p-值 , 拒绝 H02.双侧检验若p /2 /2 -值 /2 /2, 不拒绝 H0若p /2 /2 -值 ”( ”(寿命延长寿命延长) )建立的原假设与备择假设应为建立的原假设与备择假设应为 H H0 0: : 1010 H H1 1: : 1010单侧检验有一个临界值，一个拒绝域，拒绝域的面积为。分为左侧检验和右侧检验两种情况。左侧检验示意图（显著性水平与拒绝域） H H0 0值值值值临界值临界值临界值临界值样本统计量样本统计量样本统计量样本统计量拒绝

32、域拒绝域拒绝域拒绝域接受域接受域接受域接受域抽样分布抽样分布抽样分布抽样分布1 - 1 - 置信水平置信水平置信水平置信水平右侧检验示意图（显著性水平与拒绝域） H HH0 00值值值值值值临界值临界值临界值临界值临界值临界值样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域接受域接受域接受域接受域接受域接受域抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量双侧检验与

33、单侧检验 (假设的形式)第五节假设检验需要注意的问题1.要有严密的研究设计要有严密的研究设计组间应均衡，具有可比性组间应均衡，具有可比性。除对比的主要除对比的主要因素因素(如临床试验用新药和对照药如临床试验用新药和对照药)外，其它外，其它可能影响结果的因素可能影响结果的因素(如年龄、性别、病程、如年龄、性别、病程、病情轻重等病情轻重等)在对比组间应相同或相近。在对比组间应相同或相近。u配对设计计量资料：配对配对设计计量资料：配对t检验。检验。u完全随机设计两样本计量资料：完全随机设计两样本计量资料：小样本小样本(任一任一ni60)且方差齐且方差齐: 两样本两样本t检验检验方差不齐方差不齐:

34、近似近似t 检检验验大样本大样本(所有所有ni60): u检验。检验。2.不同资料应选用不同检验方法不同资料应选用不同检验方法3.正确理解正确理解“significance”一词的含义一词的含义过去称差别有或无过去称差别有或无“显著性显著性”，易造成两，易造成两样本统计量之间比较相差很大的误解。样本统计量之间比较相差很大的误解。u现在称差别有或无现在称差别有或无“统计学意义统计学意义”，相应，相应推断为：可以认为或还不能认为两个或多个总推断为：可以认为或还不能认为两个或多个总体参数有差别。体参数有差别。4.结论不能绝对化结论不能绝对化 u因统计结论具有概率性质，故因统计结论具有概率性质，故“

35、肯定肯定”、“一定一定”、“必定必定”等词不要使用。等词不要使用。u在报告结论时，最好列出检验统计量的在报告结论时，最好列出检验统计量的值，尽量写出具体值，尽量写出具体P值，而不简单写成值，而不简单写成P0.05，以便读者与同类研究进行比较或，以便读者与同类研究进行比较或进行循证医学时采用进行循证医学时采用Meta分析。分析。 P ，拒绝H0，不能认为H0肯定不成立，因为虽然在H0成立的条件下出现等于及大于现有统计量的概率虽小，但仍有可能出现；同理，P ，不拒绝H0，更不能认为H0肯定成立。由此可见，假设检验的结论是具有概率性的，无论拒绝H0或不拒绝H0，都有可能发生错误，即第一类错误或第二类

36、错误 5.统计统计“有意义有意义”与医学与医学“有意义有意义” 统计统计“有意义有意义”对应统计结论，医学对应统计结论，医学“有意义有意义”对应专业结论。对应专业结论。u统计结论有意义，专业结论无意义，统计结论有意义，专业结论无意义，最终结论没有意义，样本含量过大或设计最终结论没有意义，样本含量过大或设计存在问题。存在问题。u统计结论无意义，专业结论有意义，统计结论无意义，专业结论有意义，检查设计是否合理、样本含量是否足够。检查设计是否合理、样本含量是否足够。第六节假设检验与区间估计的联系参数估计与假设检验都是统计推断的重要内容。参数估计是根据样本统计量估计总体参数的真值；假设检验是根据样本

37、统计量来检验对总体参数的检验假设是否成立。一、区间估计与假设检验的主要区别一、区间估计与假设检验的主要区别1.区间估计通常求得的是以样本估计值为中心的双侧置信区间，而假设检验以假设总体参数值为基准，不仅有双侧检验也有单侧检验；2.区间估计立足于大概率，通常以较大的把握程度（置信水平）1-去保证总体参数的置信区间。而假设检验立足于小概率，通常是给定很小的显著性水平去检验对总体参数的先验假设是否成立。二、区间估计与假设检验的联系二、区间估计与假设检验的联系1.区间估计与假设检验都是根据样本信息对总体参数进行推断，都是以抽样分布为理论依据，都是建立在概率基础上的推断，推断结果都有一定的可信程度或风

38、险。2.对同一问题的参数进行推断，二者使用同一样本、同一统计量、同一分布，因而二者可以相互转换。区间估计问题可以转换成假设问题，假设问题也可以转换成区间估计问题。区间估计中的置信区间对应于假设检验中的接受区域，置信区间以外的区域就是假设检验中的拒绝域。因此，利用置信区间可以进行假设检验。练习1、两样本比较时，分别取以下检验水准，哪一个的第二类错误最小 A.=0.05 B.=0.01 C.=0.10 D.=0.20 E.=0.022、在假设检验中，P值和的关系为 A.P值越大，值就越大 B.P值越大，值就越小 C. P值和值均可由研究者事先设定 D. P值和值都不可以由研究者事先设定

39、E. P值的大小与值的大小无关 3、假设检验中的第二类错误是指A.拒绝了实际上成立的H0 B.不拒绝实际上成立的H0C.拒绝了实际上成立的H1 D.不拒绝实际上不成立的H0 E.拒绝时所犯的错误4、统计推断的内容是A用样本指标推断总体指标 B检验统计上的“假设”CA、B均不是 DA、B均是是非题1进行两均数差别的假设检验时，当P0.05时，则拒绝H0；当P0.05时，则接受H0，认为两总体均数无差别。答案：错误。当答案：错误。当P P 0 0.0505，拒绝，拒绝H H0 0时，我们是依据时，我们是依据这一小概率来下结论的。而当这一小概率来下结论的。而当P P 0 0.0505时，时，我们我

40、们对两总对两总体均数无差别这一结论无任何概率保证，因此不能贸体均数无差别这一结论无任何概率保证，因此不能贸然下无差别的结论。正确的说法是，按所取检验水准然下无差别的结论。正确的说法是，按所取检验水准，接受接受H H1 1的统计证据不足的统计证据不足，或尚不能认为两总体均，或尚不能认为两总体均数有差别。数有差别。 2通常单侧检验较双侧检验更为灵敏，更易检验出差别，应此宜广泛使用。答案：错误。根据专业知识推断两个总体是否有差答案：错误。根据专业知识推断两个总体是否有差别时，是甲高于乙，还是乙高于甲，当两种可能都存别时，是甲高于乙，还是乙高于甲，当两种可能都存在时，一般选双侧；若根据专业知识，如果甲

41、不会低在时，一般选双侧；若根据专业知识，如果甲不会低于乙，或者研究者仅关心其中一种可能时，可选用单于乙，或者研究者仅关心其中一种可能时，可选用单侧。一般来讲，双侧检验较为稳妥。单侧检验，应以侧。一般来讲，双侧检验较为稳妥。单侧检验，应以专业知识为依据，它充分利用了另一侧的不可能性，专业知识为依据，它充分利用了另一侧的不可能性，故检出率高，但应慎用。故检出率高，但应慎用。3只要增加样本含量到足够大，就可以避免I和II型错误。答案：错误。因为通过假设检验推断出的结论具有概率性，因此出现错误判断的可能性就一定存在，无论用任何方法也不能消除这一可能。但是，我们可以使错误判断的可能性尽量地小，比如样本含

42、量越大，犯I和II类错误的可能性越小。 4、若两样本均数比较的假设检验结果P值远远小于0.01，则说明差异非常大。错。错。P P 值的大小只能说明差异是否有统计学意义，值的大小只能说明差异是否有统计学意义，同样的差异，例数越多，同样的差异，例数越多，P P 值越小。值越小。5 5、对同一参数的估计，对同一参数的估计，99%99%可信区间比可信区间比90%90%可信可信区间好。区间好。错。可信区间的优劣要通过两点衡量：区间的可信错。可信区间的优劣要通过两点衡量：区间的可信度；区间的宽度。因此不能笼统的通过区间可信度度；区间的宽度。因此不能笼统的通过区间可信度的大小来评价优劣。的大小来评价优劣。简

43、答题1 简述可信区间在假设检验问题中的作用。可信区间不仅能回答差别有无统计学意义，而且可信区间不仅能回答差别有无统计学意义，而且还能提示差别有无实际意义。可信区间只能在预先规还能提示差别有无实际意义。可信区间只能在预先规定的概率即检验水准定的概率即检验水准的前提下进行计算，而假设检的前提下进行计算，而假设检验能够获得一较为确切的概率验能够获得一较为确切的概率P P 值。故将二者结合起值。故将二者结合起来，才是对假设检验问题的完整分析。来，才是对假设检验问题的完整分析。2 2、简述、简述假设检验中假设检验中P P 的含义的含义指从指从H H0 0 规定的总体随机抽得等于及大于（或等于规定的总体随

44、机抽得等于及大于（或等于及小于）现有样本获得的检验统计量值的概率。及小于）现有样本获得的检验统计量值的概率。 3、假设检验时，当P 0.05，则拒绝H0，理论依据是什么？答：答：P P 值系由值系由H H0 0所规定的总体做随机抽样，获得所规定的总体做随机抽样，获得等于及大于（或等于及小于）依据现有样本信息所等于及大于（或等于及小于）依据现有样本信息所计算得的检验统计量的概率。计算得的检验统计量的概率。当当P P 0.050.05时，说明在时，说明在H H0 0成立的条件下，得到成立的条件下，得到现有检验结果的概率小于现有检验结果的概率小于，因为小概率事件几乎因为小概率事件几乎不可能在一次试验

45、中发生，所以拒绝不可能在一次试验中发生，所以拒绝H H0 0。同时，下。同时，下“有差别有差别”的结论的同时，我们能够知道可能犯错的结论的同时，我们能够知道可能犯错误的概率不会大于误的概率不会大于，也就是说，有了概率保证。也就是说，有了概率保证。，4、假设检验中与P的区别何在？答：以t检验为例，与P都可用t分布尾部面积大小表示，所不同的是：值是指在统计推断时预先设定的一个小概率值，就是说如果H0是真的，允许它错误的被拒绝的概率。P值是由实际样本获得的，是指在H0成立的前提下，出现等于或大于现有检验统计量的概率。名词解释1、I型和II型错误I I型错误（型错误（type I error），指拒绝

46、了实际上成立的），指拒绝了实际上成立的H H0 0，这类，这类“弃真弃真”的错误称为的错误称为I型错误，其概率大小用型错误，其概率大小用表示；表示；IIII型错误（型错误（type II errortype II error），指接受了实），指接受了实际上不成立的际上不成立的H H0 0，这类，这类“存伪存伪”的误称为的误称为IIII型错误，型错误，其概率大小用其概率大小用表示。表示。2 2、检验水准检验水准或显著性水平或显著性水平是预先规定的，当假设检验结果拒绝是预先规定的，当假设检验结果拒绝H H0 0，接受，接受H H1 1，下下“有差别有差别”的结论时犯错误的概率称为检验水准的结论时犯错误的概率称为检验水准（level of a test），记为），记为。

展开阅读全文

第七章假设检验

最新文档