分布类型的检验PPT课件

资源描述

《分布类型的检验PPT课件》由会员分享，可在线阅读，更多相关《分布类型的检验PPT课件（51页珍藏版）》请在金锄头文库上搜索。

1、第三部分常用假设检验方法第第10章分布类型的检验章分布类型的检验10.1假设检验的基本思想假设检验的基本思想10.2正态分布检验正态分布检验10.3二项分布检验二项分布检验10.4游程检验游程检验10.5本章小结本章小结第第11章连续变量的统计推断章连续变量的统计推断(一一)t检验检验11.1t检验基础检验基础11.2样本均数与总体均数的比较样本均数与总体均数的比较11.3成组设计两样本均数的比较成组设计两样本均数的比较11.4配对设计样本均数的比较配对设计样本均数的比较11.5本章小结本章小结10.1假设检验的基本思想假设检验的基本思想n10.1.1问题的提出问题的提出n10.1.2假设检验

2、的基本思想假设检验的基本思想n10.1.3假设检验的两类错误假设检验的两类错误n10.1.4假设检验中的其他问题假设检验中的其他问题10.1.1问题的提出问题的提出n在总体的分布函数完全未知或只知其形式，但不知其参数的情况在总体的分布函数完全未知或只知其形式，但不知其参数的情况下，为了推断总体的某些性质，提出某些关于总体的假设。下，为了推断总体的某些性质，提出某些关于总体的假设。n例如，提出总体服正态分布的假设；对正态总体提出均值等于例如，提出总体服正态分布的假设；对正态总体提出均值等于a0的假设等等。的假设等等。n假设检验就是根据样本对所提出的假设作出判断：是接受，还是假设检验就是根据样本对

3、所提出的假设作出判断：是接受，还是拒绝。拒绝。10.1.1问题的提出问题的提出n假设检验是用来判断样本与样本，样本与总体假设检验是用来判断样本与样本，样本与总体的差异是由抽样误差引起还是本质差别造成的的差异是由抽样误差引起还是本质差别造成的统计推断方法。统计推断方法。10.1.2假设检验的基本思想假设检验的基本思想n如何利用样本值对一个具体的假设进行检验如何利用样本值对一个具体的假设进行检验?n通常借助于直观分析和理论分析相结合的做法通常借助于直观分析和理论分析相结合的做法,其基本原理就是人们在实际问题中经常采用的其基本原理就是人们在实际问题中经常采用的所谓小概率反证法思想。所谓小概率反证法思

4、想。n小概率思想是指小概率事件（小概率思想是指小概率事件（P0.01或或P5）。备选假设记为）。备选假设记为H1a。n备选假设应该按照实际世界所代表的方向来确备选假设应该按照实际世界所代表的方向来确定，即它通常是被认为可能比零假设更符合数定，即它通常是被认为可能比零假设更符合数据所代表的现实。据所代表的现实。n比如上面的比如上面的H1为为a5；这意味着，至少样本；这意味着，至少样本均值应该大于均值应该大于5；10.1.2假设检验的基本思想假设检验的基本思想n至于是否显著，依检验结果而定。至于是否显著，依检验结果而定。n检验结果显著检验结果显著(significant)意味着有理由拒意味着有理由

5、拒绝零假设。因此，假设检验也被称为显著性检绝零假设。因此，假设检验也被称为显著性检验验(significanttest)。10.1.2假设检验的基本思想假设检验的基本思想n有了两个假设，就要根据数据来对它们进行判有了两个假设，就要根据数据来对它们进行判断。断。n数据的代表是作为其函数的统计量；它在检验数据的代表是作为其函数的统计量；它在检验中被称为检验统计量（中被称为检验统计量（teststatistic）。）。n根据零假设（不是备选假设！），可得到该检根据零假设（不是备选假设！），可得到该检验统计量的分布；再看这个统计量的数据实现验统计量的分布；再看这个统计量的数据实现值（值（realiza

6、tion）属不属于小概率事件。）属不属于小概率事件。10.1.2假设检验的基本思想假设检验的基本思想n也就是说把数据代入检验统计量也就是说把数据代入检验统计量,看其值是否看其值是否落入零假设下的小概率范畴；落入零假设下的小概率范畴；n如果的确是小概率事件，那么就有可能拒绝零如果的确是小概率事件，那么就有可能拒绝零假设，或者说假设，或者说“该检验显著。该检验显著。”n否则说否则说“没有足够证据拒绝零假设没有足够证据拒绝零假设”，或者，或者“该检验不显著。该检验不显著。”10.1.2假设检验的基本思想假设检验的基本思想n在零假设下，检验统计量取其实现值及（沿着在零假设下，检验统计量取其实现值及（沿

7、着备选假设的方向）更加极端值的概率称为备选假设的方向）更加极端值的概率称为p-值值（p-value）。）。n如果得到很小的如果得到很小的p-值，就意味着在零假设下小值，就意味着在零假设下小概率事件发生了。概率事件发生了。n如果小概率事件发生，是相信零假设，还是相如果小概率事件发生，是相信零假设，还是相信数据呢？信数据呢？n当然多半是相信数据，拒绝零假设。当然多半是相信数据，拒绝零假设。10.1.2假设检验的基本思想假设检验的基本思想n但小概率并不能说明不会发生，仅仅发生的概但小概率并不能说明不会发生，仅仅发生的概率很小罢了。拒绝正确零假设的错误常被称为率很小罢了。拒绝正确零假设的错误常被称为第

8、一类错误（第一类错误（typeIerror）。）。n在备选假设正确时反而说零假设正确的错误，在备选假设正确时反而说零假设正确的错误，称为第二类错误（称为第二类错误（typeIIerror）。）。10.1.2假设检验的基本思想假设检验的基本思想n零假设和备选假设哪一个正确，是确定性的，零假设和备选假设哪一个正确，是确定性的，没有概率可言。而可能犯错误的是人。没有概率可言。而可能犯错误的是人。n涉及假设检验的犯错误的概率就是犯第一类错涉及假设检验的犯错误的概率就是犯第一类错误的概率和犯第二类错误的概率。误的概率和犯第二类错误的概率。n负责任的态度是无论做出什么决策，都应该给负责任的态度是无论做出什

9、么决策，都应该给出该决策可能犯错误的概率。出该决策可能犯错误的概率。10.1.2假设检验的基本思想假设检验的基本思想n到底到底p-值是多小时才能够拒绝零假设呢？也就是说，值是多小时才能够拒绝零假设呢？也就是说，需要有什么是小概率的标准。需要有什么是小概率的标准。n这要看具体应用的需要。但在一般的统计书和软件中，这要看具体应用的需要。但在一般的统计书和软件中，使用最多的标准是在零假设下（或零假设正确时）根使用最多的标准是在零假设下（或零假设正确时）根据样本所得的数据来拒绝零假设的概率应小于据样本所得的数据来拒绝零假设的概率应小于0.05，当然也可能是当然也可能是0.01，0.005，0.001等

10、等。等等。10.1.2假设检验的基本思想假设检验的基本思想n这种事先规定的概率称为显著性水平这种事先规定的概率称为显著性水平(significantlevel)，用字母，用字母alpha来表示。来表示。nalpha并不一定越小越好，因为这很可能导致并不一定越小越好，因为这很可能导致不容易拒绝零假设，使得犯第二类错误的概率不容易拒绝零假设，使得犯第二类错误的概率增大。增大。10.1.2假设检验的基本思想假设检验的基本思想n当当p-值小于或等于值小于或等于alpha时，就拒绝零假设。时，就拒绝零假设。所以，所以，alpha是所允许的犯第一类错误概率的是所允许的犯第一类错误概率的最大值。当最大值。当

11、p-值小于或等于值小于或等于alpha时，拒绝原时，拒绝原假设假设H0，就说这个检验是显著的。，就说这个检验是显著的。n无论统计学家用多大的无论统计学家用多大的alpha作为显著性水平作为显著性水平都不能脱离实际问题的背景。统计显著不一定都不能脱离实际问题的背景。统计显著不一定等价于实际显著。反过来也一样。等价于实际显著。反过来也一样。10.1.2假设检验的基本思想假设检验的基本思想n实际上，多数计算机软件仅仅给出实际上，多数计算机软件仅仅给出p-值，这有值，这有很多方便之处。很多方便之处。n比如比如alpha=0.05，而假定所得到的，而假定所得到的p-值等于值等于0.001。这时如果采用。

12、这时如果采用p-值作为新的显著性水值作为新的显著性水平，即新的平，即新的alpha=0.001，于是就可以说，在，于是就可以说，在显著性水平为显著性水平为0.001时，拒绝零假设。时，拒绝零假设。10.1.2假设检验的基本思想假设检验的基本思想n这样，拒绝零假设时犯错误的概率实际只是千这样，拒绝零假设时犯错误的概率实际只是千分之一而不是旧的分之一而不是旧的alpha所表明的百分之五。所表明的百分之五。在这个意义上，在这个意义上，p-值又称为观测的显著性水平值又称为观测的显著性水平（observedsignificantlevel）。）。n在统计软件输出在统计软件输出p-值的位置，有的用值的位置

13、，有的用“p-value”，有的用，有的用significant的缩写的缩写“Sig”就就是这个道理。是这个道理。10.1.2假设检验的基本思想假设检验的基本思想归纳起来，假设检验的一般步骤为：归纳起来，假设检验的一般步骤为：n1.写出零假设和备选假设；写出零假设和备选假设；n2.确定检验统计量；确定检验统计量；n3.确定显著性水平；确定显著性水平；n4.根据数据计算检验统计量的实现值；根据数据计算检验统计量的实现值；n5.根据这个实现值计算根据这个实现值计算p-值；值；10.1.2假设检验的基本思想假设检验的基本思想q6.进行判断：如果进行判断：如果p-值小于或等于值小于或等于alpha，就

14、拒绝，就拒绝零假设，这时犯（第一类）错误的概率最多为零假设，这时犯（第一类）错误的概率最多为alpha；如果；如果p-值大于值大于alpha，就不拒绝零假设，因，就不拒绝零假设，因为证据不足。为证据不足。10.1.4假设检验中的其他问题假设检验中的其他问题（1）做假设检验之前，应注意资料本身是否有）做假设检验之前，应注意资料本身是否有可比性。可比性。（2）当差别有统计学意义时应注意这样的差别）当差别有统计学意义时应注意这样的差别在实际应用中有无意义。在实际应用中有无意义。（3）根据资料类型和特点选用正确的假设检验）根据资料类型和特点选用正确的假设检验方法。方法。（4）根据专业及经验确定是选用单

15、侧检验还是）根据专业及经验确定是选用单侧检验还是双侧检验。双侧检验。10.1.4假设检验中的其他问题假设检验中的其他问题（5）当检验结果为拒绝无效假设时，应注意有）当检验结果为拒绝无效假设时，应注意有发生发生I类错误的可能性，即错误地拒绝了本身类错误的可能性，即错误地拒绝了本身成立的成立的H0，发生这种错误的可能性预先是知道，发生这种错误的可能性预先是知道的，即检验水准那么大；当检验结果为不拒绝的，即检验水准那么大；当检验结果为不拒绝无效假设时，应注意有发生无效假设时，应注意有发生II类错误的可能性，类错误的可能性，即仍有可能错误地接受了本身就不成立的即仍有可能错误地接受了本身就不成立的H0，

16、发生这种错误的可能性预先是不知道的，但与发生这种错误的可能性预先是不知道的，但与样本含量和样本含量和I类错误的大小有关系。类错误的大小有关系。10.1.4假设检验中的其他问题假设检验中的其他问题（6）判断结论时不能绝对化，应注意无论接受）判断结论时不能绝对化，应注意无论接受或拒绝检验假设，都有判断错误的可能性。或拒绝检验假设，都有判断错误的可能性。（7）报告结论时是应注意说明所用的统计量，）报告结论时是应注意说明所用的统计量，检验的单双侧及检验的单双侧及P值的确切范围。值的确切范围。10.2正态分布检验正态分布检验10.2.1K-S检验的原理检验的原理10.2.2分析实例分析实例10.2.1K

17、-S检验的原理检验的原理n单样本的单样本的Kolmogorov-Smirnov检验（检验（K-S检检验，柯尔莫哥诺夫验，柯尔莫哥诺夫-斯米尔诺夫检验）是用来斯米尔诺夫检验）是用来检验一个数据的观测累积分布是否是已知的理检验一个数据的观测累积分布是否是已知的理论分布。论分布。n设总体设总体XF(x)，F(x)是未知的，是未知的，F0(x)是一个是一个给定的分布函数，欲检验给定的分布函数，欲检验H0:F(x)=F0(x)10.2.1K-S检验的原理检验的原理n由于当由于当n较大时，理论上有经验分布函数较大时，理论上有经验分布函数Fn(x)是是F(x)的良好近似。的良好近似。n构造构造Kolmogo

18、rovSmirnov统计量统计量n来反映来反映F(x)和和F0(x)之间的差异，若之间的差异，若D较小，表明二较小，表明二者间没有显著差异，否则有显著差异。者间没有显著差异，否则有显著差异。10.2.1K-S检验的原理检验的原理nKolmogorovSmirnov证明了统计量证明了统计量D的极限分布的极限分布为为Q()分布，计算出分布，计算出n记为记为Z值值，并根据极限分布计算出相应的显著性概率，并根据极限分布计算出相应的显著性概率n若若Sig.小于给点的显著性水平小于给点的显著性水平alpha，则拒绝，则拒绝H0,否则，否则，接受接受H0.10.2.2分析实例分析实例n例例12.1请判断请判

19、断SPSS自带数据集自带数据集anxity.sav中中score的分布是否服从正态分布。的分布是否服从正态分布。n操作如下：操作如下：nAnalyzeNonparametictest1-sampleK-STestvariablelist框：选入框：选入scorenTestdistribution复选框组：选中复选框组：选中normal复选框复选框n单击单击OK钮钮n系统给出的统计分析结果，具体如下：系统给出的统计分析结果，具体如下：n数据文件数据文件n操作过程操作过程n由于由于p=Sig.=0.6520.05，故接受原假设，认，故接受原假设，认为为score服从正态分布。服从正态分布。变量名变

20、量名Score样本量样本量48正态分布参数正态分布参数均数均数10.00标准差标准差5.17最极端的差异最极端的差异绝对值绝对值.106正值正值.088负值负值-.106K-S检验的统计量检验的统计量Z值值.735近似近似P值值(双侧双侧).652注意注意nK-S检验可检验可以检验以检验n正态分布，正态分布，n均匀分布，均匀分布，n泊松分布，泊松分布，n指数分布。指数分布。10.3二项分布检验二项分布检验10.3.1二项分布检验的原理二项分布检验的原理10.3.2分析实例分析实例10.3.1二项分布检验的原理二项分布检验的原理n当一个变量只取当一个变量只取0，1值时，称为二分值变量。值时，称为

21、二分值变量。n当一个问题只有两种可能结果时，称为二分值当一个问题只有两种可能结果时，称为二分值问题。问题。n二分值问题的一种结果称为二分值问题的一种结果称为“成功成功”，另一种，另一种称为称为“失败失败”。n二项分布检验（二项分布检验（BinomialTest）就是对二分）就是对二分值问题的成功概率进行检验。值问题的成功概率进行检验。10.3.1二项分布检验的原理二项分布检验的原理n设设S+表示对二分值问题进行表示对二分值问题进行n次试验中成功的次试验中成功的次数。次数。n例如用同样的方法掷一枚硬币例如用同样的方法掷一枚硬币100次，出现正次，出现正面面44次，出现反面次，出现反面56次，问该

22、硬币是否均匀？次，问该硬币是否均匀？n该例中该例中S+=44，S-=56，检验假设为：，检验假设为：H0:p=p0=0.5n当当H0为真时，为真时，S+服从参数为服从参数为P0的二项分布。的二项分布。10.3.1二项分布检验的原理二项分布检验的原理n计算计算S+的值，并根据二项分布计算相应的显的值，并根据二项分布计算相应的显著性概率著性概率Sig.，若，若Sig.小于给定的显著性水平小于给定的显著性水平alpha，则拒绝，则拒绝H0，否则接受拒绝，否则接受拒绝H0。n因为是基于二项分布的概率进行判断，所以此因为是基于二项分布的概率进行判断，所以此种检验法称为二项分布检验法。种检验法称为二项分布

23、检验法。n当试验总次数当试验总次数n较大时，较大时，S+近似服从正态分布。近似服从正态分布。所以往往根据正态分布计算所以往往根据正态分布计算Sig.的近似值。的近似值。10.3.2分析实例分析实例n例例10.6根据以往经验，新生儿染色体异常率一般根据以往经验，新生儿染色体异常率一般为为1%，现某医院观察了当地共，现某医院观察了当地共400名新生儿，只名新生儿，只发现一例染色体异常。数据见发现一例染色体异常。数据见binominal.sav，该地新生儿染色体异常率是否低于一般？该地新生儿染色体异常率是否低于一般？10.3.2分析实例分析实例n原假设：原假设：H0：p=0.01，异常率并无不同，异

24、常率并无不同n备择假设：备择假设：H1：pBinomialqTestVariable：染色体异常率：染色体异常率illqTestProportion：0.0110.3.2分析实例分析实例nSig=.090(按按正正态态分分布布近近似似计计算算)0.05，不不能能拒拒绝绝原假设，尚不能认为异常率低于一般。原假设，尚不能认为异常率低于一般。10.4游程检验游程检验10.4.1游程检验的原理游程检验的原理10.4.2分析实例分析实例10.4.1游程检验的原理游程检验的原理n游程检验（游程检验（Runstest）与二项分布检验都是）与二项分布检验都是对二分值问题进行检验，但它不是对对二分值问题进行检验

25、，但它不是对“成功成功”概率进行检验，而是检验多个二分值问题之间概率进行检验，而是检验多个二分值问题之间是否相互独立？是否相互独立？n原假设原假设H0：多个二分值问题之间独立：多个二分值问题之间独立n游程检验是基于游程数的多少来检验，那么什游程检验是基于游程数的多少来检验，那么什么是游程呢？么是游程呢？10.4.1游程检验的原理游程检验的原理n游程就是游程就是0，1序列中序列中0或者或者1的连续段，即的连续段，即0或或1的每个连续段称为一个游程。的每个连续段称为一个游程。n设天气预报记录设天气预报记录20天是否下雨的情况，得到以天是否下雨的情况，得到以下序列（下序列（1表示下雨，表示下雨，0表

26、示不下雨）表示不下雨）00110111000100100010，研究者想知道某一，研究者想知道某一天下雨或不下雨对以后天气是否下雨有无影响天下雨或不下雨对以后天气是否下雨有无影响？n易知该记录总游程数易知该记录总游程数U=11。10.4.1游程检验的原理游程检验的原理n如果原假设如果原假设H0成立，则成立，则0，1序列交替均匀，从序列交替均匀，从而总游程数而总游程数U较大，否则较大，否则U较小。较小。n所以，我们可以通过总游程数所以，我们可以通过总游程数U的大小来判断的大小来判断H0是否成立。是否成立。n选择选择U为检验统计量，当样本数为检验统计量，当样本数n较大时，较大时，U近近似服从正态分

27、布。似服从正态分布。n根据相应分布计算根据相应分布计算p值，然后做出判断。值，然后做出判断。10.4.2分析实例分析实例n设天气预报记录设天气预报记录20天是否下雨的天是否下雨的情况，得到以下序列（情况，得到以下序列（1表示下雨，表示下雨，0表示不下雨）表示不下雨）00110111000100100010，研究，研究者想知道某一天下雨或不下雨对者想知道某一天下雨或不下雨对以后天气是否下雨有无影响？以后天气是否下雨有无影响？n建立数据文件见右图所示建立数据文件见右图所示10.4.2分析实例分析实例nAnalyzeNonparametricTestsRunsnTestVariable:下雨否下雨否

28、nCutPoint：Custom：1n注注意意：有有时时在在一一些些数数据据表表中中所所检检验验的的变变量量不不是是二二分分值值变变量量，如如教教材材例例10.7，此此时时需需要要给给定定一一个个分分割割点点（CutPoint）,把把它它转转化化为为二二分分值值变变量量。小小于于分分割割点的转为点的转为0，其余为，其余为1.nCut Point框框中中供供选选择择的的有有：Median(中中位位数数)、Mode(众众数数)、Mean(平平均均数数)和和Custom(自自定定义义分分割割点点)几种形式。几种形式。10.4.2分析实例分析实例n结果说明：结果说明：n分割点为分割点为1n总总case数数20n游程游程Run数数11n近似近似Sig.=10.05n不不能能拒拒绝绝原原假假设设，认认为为某某一一天天是是否否下下雨雨对对以以后后天天气气是是否否下雨无显著影响。下雨无显著影响。10.5本章小结本章小结 1.假设检验的原理、基本步骤及相关概念；假设检验的原理、基本步骤及相关概念；2.参数检验与非参数检验的概念；参数检验与非参数检验的概念；3.几种常用的非参数检验：几种常用的非参数检验：q正态分布检验正态分布检验q二项分布检验二项分布检验q游程检验游程检验熟悉分析过程及结果解释。熟悉分析过程及结果解释。

展开阅读全文

分布类型的检验PPT课件

最新文档