第7章假设检验－金锄头文库

资源描述

《第7章假设检验》由会员分享，可在线阅读，更多相关《第7章假设检验（134页珍藏版）》请在金锄头文库上搜索。

1、第七早假设检验假设检验的基本原理总体参数假设检验非参数检验第一节假设检验的基本原理假设检验的基本原理假设检验的规则与两类错误检验功效一、假设检验的基本原理假设检验是统计推断的另一项重要组成部分，是参数估计的延续，是对参数估计在统计上的验证与补充。它首先对考察总体的分布形式或总体的某些未知参数事先做出某些假设，然后根据检验对象构造合适的检验统计量并经过数理统计分析，确定在假设下，该检验统计量的抽样分布；在给定的显著性水平下，从抽样分布中得出鉴别对原先假设的拒绝域和接受域的临界值；之后由所抽取的样本资料计算样本统计量，并将样本统计量与临界统计量进行比较，从而对所提出的原假设做出

2、统计判断：是接受还是拒绝原假设。也就是从样本中所蕴含的信息来对总体情况进行判断。假设检验所遵循的推断依据是统计中的“小概率原理” ：小概率事件在一次试验中几乎是不会发生的。举个例子来说，在10000件的产品中，如果只有1件是次品，那么可以得知，在一次试验中随机抽取1件产品，它为次品的概率就为01.01，此概率是非常小的。或者是说，在一次随机抽样试验中，次品几乎是不会被抽到的。反过来，如果从这批产品中随机抽取1 件，恰好是次品，那么，我们就有理由怀疑该批产品的次品率不是很小，否则就不会那么容易地抽到次品。因此，有足够的理由否认该批产品的次品率很低的假设。通常概率要多大才能算得上是小概

3、率呢？假设检验中把这个小概率称为显著性水平，其取值的大小与我们能否做出正确判断有着相当大的关系。然而，的取值并没有固定的标准，只能根据实际需要来确定。一般地，取），对于一些比较严格的情况，例如在一些高精密质量检验的假设检验中，它可以取0.01或者更小。越小，所做出的拒绝原假设的判断的说服力就越强。当然，不管有多么地小，也不能代表小概率事件没有发生的可能，这也正是假设检验与数学上“反证法”的不同之处。所以，对于拒绝或者接受，都只是统计意义上的，并不是完全意义上的。这一点在学习假设检验过程中是容易被疏忽的。事先建立假设，是假设检验中关键的一项工作。它包括原假设和备选假设两部

4、分。原假设是建立在假定原来总体没有发生变化的基础之上的，也就是总体参数没有显著变化。备选假设是原假设的对立，是在否认原假设之后所要接受的内容，通常这是我们真正感兴趣的一个判断。例如在上面的例子中，如果想确认次品率是否为0.01，我们可以分别建立原假设和备选假设为：H0:p0=0.01%1:p0工 0.01%；如果我们想确认次品率是否大于(小于)0.01，那么对应的备选假设为:H1:p0>0.01% (或p0<0.01% )，原假设与前面相同。由此可见，备选假设与原假设的建立不是随意的，而是要根据研究的需要来确定的。应当指出，在假设检验中，相对而言，当原假设被拒绝时

5、，我们能够以较大的把握肯定备选假设的成立；而当原假设不能被拒绝时，我们并不能断定原假设确实成立。例如，当给定的0为0.01时，如果检验统计量的取值落入其发生概率不超过0.04但又大于0.01的区域时，我们不能拒绝原假设。但事实上，在原假设成立的前提下，其发生的概率最多只有0.04，因此难以断定原假设成立。如果将显著水平定为0.05,则原假设就会被拒绝。假设检验按照所检验内容的不同，可以分为参数检验和非参数检验。对已知总体分布的某个未知参数进行的检验，称为参数检验；对总体的分布形式进行的检验，则称为非参数检验。本章将分别对这两类检验进行介绍。二、假设检验的规则与两类错误（一

6、）假设检验的规则综合上面假设检验的原理分析，给出假设检验的步骤：1根据实际应用问题确定合适的原假设H和备选假设H1?2确定检验统计量，通过数理统计分析确定该统计量的抽样分布；3给定检验的显著性水平a，在原假设成立的条件下，结合备选假设的定义，由检验统计量的抽样分布情况求出相应的临界值，该临界值为原假设的接受域与拒绝域的分界值；4从样本资料计算检验的样本统计量，并将其与临界值进行比较，判断是否接受或拒绝原假设。上面步骤中，对检验统计量抽样分布的确认属于高深的概率数理统计的研究内容，本处我们不作探讨。从检验程序我们可以看出，统计量的取值范围可以分为接受域和拒绝域两个区域。拒绝域

7、正就是统计量取值的小概率区域。按照我们将这个拒绝域安排在所检验统计量的抽样分布的某一侧还是两端，可以将检验分为单侧检验和双侧检验。单侧检验中，又可以根据拒绝域，是在左侧还是在右侧而分为左侧检验和右侧检验。对于上述的情况，我们可以通过服从检验统计量的分布图来形象表示：7-1双侧检验与单侧检验图中的阴影部分为拒绝域，对应的分别是双侧、左单侧、右单侧检验。实际应用中，是采用双侧检验还是单侧检验？单侧检验中，是采用左单侧还是右单侧呢？例如，某公司采取了新的销售方案，我们想检验新方案下销售收入是否与实施前的有差异，即是否等同于原来的销售收入水平，对该情况的检验就是双侧检验

8、。如果我们想检验新方案下的销售收入水平是否有所提高，此时检验就转化为单侧检验了，而且是右侧检验。同理，如果想检验收入水平是否低于实施前的收入水平，就要采用单侧检验中的左侧检验。也就是说，选用双侧、左侧或右侧检验时，要结合备选假设来考虑。又如，前面提到的次品率的例子中，如果备选假设为H1:p0工 0.01%，就是双侧检验；如果备选假设为H1:p<(#>） 0.01%，就是属于左（右）单侧检验。在检验规则中，我们经常碰到两种重要的检验方法：z检验与t检验。1z检验。又称为正态分布检验，该检验认为所检验的统计量服从正态分布。例如，从正态分布总体中抽取一个样本，则样本均

9、值服从正态分布；从一般非正态分布总体中抽样，当样本容量n很大时，样本均值近似地服从正态分布，其中CT为总体标准差。因为统计量N(0,1)所以，我们可以利用标准正态分布来进行检验。根据给定的显著性水平，标准正态分布的临界表中查得临界值，将z统计量的取值与临界值比较来判断能否拒绝原假设。#检验。在检验中，当总体的标准差CT未知时，需要用样本标准差来代替，从而构成统计量。同样，从t分布的临界表中查得临界值，并将样本统计量的值与其比较做出判断。p值检验在上面的检验步骤中，判断最后是接受原假设还是拒绝原假设依据是，计算的样本统计量的数值与检验统计量的临界值的大小比较。此外，我们也可以根据计算

10、的概率值p来判断能否拒绝原假设，这就是p值检验。现在在众多流行的统计计量软件中（如SASSPSSEXCEL等），最后的结果表中都给出了p值。p值检验的原理：建立原假设后，在假定原假设成立的情况下，参照备选假设，可以计算出检验统计量超过或者小于（还要依照分布的不同、单侧检验、双侧检验的差异而定）由样本所计算出的检验统计量的数值的概率，这便是p值；而后将此p值与事先给出的显著性水平a进行比较，如果p值小于a，也就是说，原假设对应的为小概率事件，根据上述的“小概率原理” ，我们就可以否定原假设，而接受对应的备选假设。如果p值大于a，我们不就能否定原假设。例如，对应上面的检验中，如果是

11、双侧检验，根据上面的说明，可以计算若pa，那么我们就可以否认原假设，反之不能否定原假设。p 值检验与前面介绍的方法得出的结论是一致的。（三）两类错误在假设检验中，对假设的检验判断是依据样本实际资料所计算的统计量的值与临界值的比较来做出的。由于样本的随机性、样本信息的分散性等原因，这种合理的“以偏概全” 式的假设检验，总是无法让我们百分百的肯定所做出结论的正确性。也就是说，我们有可能会做出错误的判断，这种风险是客观存在的。例如，实际上依据真实总体情况，我们应该接受原假设H0，但根据样本信息，却做出拒绝H0的错误结论，称这种错误为 “弃真”错误；此外，我们也可能犯这样的错误：实际的

12、总体情况是应该拒绝原假设，而我们却接受了它，称此为“纳伪”错误。对于上述的两类错误，我们都希望能尽量减少其发生的概率。因此需要对它们的概率进行简要分析。在假设中，我们给出了显著性水平a（概率值），在“小概率事件是几乎不会发生的”原理上，如果样本资料的信息与总体信息之间的差异出现的概率小于等于a，那么可以认为在一次试验中该事件不会发生（发生的可能性a很小），从而我们就拒绝了原假设。这就是说，有a的可能性发生原假设是真实的却被拒绝的情况。所以显著性水平a就是我们犯“弃真”错误的可能性大小。B越小，则犯“弃真”错误的可能性就越小。因而，可以根据实际需要对显著性水平a加以控制，一般取a=0.0

13、5（或者a=0.1），这就保证犯“弃真”错误的可能性不超过5（或者1）。如果要求更加严格，a可取更小的数值。通常记为犯“纳伪”错误的可能性大小。由于两类错误是一对矛盾，在其他条件不变的情况下，减少犯“弃真”错误的可能性（a），势必增大犯“纳伪”错误的可能性（），也就是说，B的大小和显著性水平a的大小成相反方向变化。两类错误发生的概率的相对关系可由下面的图形来表示：图7-2两类错误从图7-2中，我们也可以看出，当真实分布与待判别分布越远离时，在a一定下，B将越小；也就是说，当差别比较明显时，我们犯错误的可能性会更小，反之亦然。假设三、检验功效由于为犯“纳伪”错误的可能性大小，或者说B表示出现接

14、受不真实的原假设的结论的概率，那么1B就是指出现拒绝不真实的原假设的概率。若1B的数值越接近于1，表明不真实的原假设几乎都能够被拒绝。诚然，如果1B的数值接近于0，表明犯“纳伪”错误的可能性很大。因此，1B可以用来表明所做假设检验工作好坏的一个指标，我们称之为检验功效。它的数值表明我们做出正确决策的概率为1-B一个好的检验法则总是希望犯两类错误的可能性a与B都很小，但是这在一般场合下是很难实现的。要使得a小，必然导致B大，若要使B小，必导致a增大。在实际检验中，一般首先控制犯“弃真”错误的概率，也就是事先给出的显著性水平a的数值尽量地小，在其它条件不变的情况下，增加犯“纳伪”错误的可能性，即B增大，从而使得检验功效（1-B）减弱。在此情况下，如何增强检验功效？解决的唯一办法只有增大样本容量，这样既能保证满足取得较小的a，又能取得较小的值，一举两得。然而实际上样本容量的取得是有限制的，只能根据实际来确定0第二节总体参数假设检验总体均值的假设检验两个总体均值之差的检验总体成数的假设检验总体均值的假设检验两个正态总体方差

展开阅读全文