SPSS的非参数检验－金锄头文库

资源描述

《SPSS的非参数检验》由会员分享，可在线阅读，更多相关《SPSS的非参数检验（36页珍藏版）》请在金锄头文库上搜索。

1、第七章非参数检验,7.1 关于非参数的一些常识,经典统计的多数检验都假定了总体的背景分布。但在总体未知时，如果假定的总体和真实总体不符，那么就不适宜用通常的检验。这时如果利用传统的假定分布已知的检验，就会产生错误甚至灾难。非参数检验(nonparametric testing)是在总体分布未知或知之甚少的情况下，利用样本数据对总体分布形态等进行推断的方法。,非参数检验在总体分布未知时有很大的优越性。它总是比传统检验安全。在总体分布形式已知时，非参数检验不如传统方法效率高。这是因为非参数方法利用的信息要少些。往往在传统方法可以拒绝零假设的情况，非参数检验无法拒绝。但非参数统计在总体未知时效率要

2、比传统方法要高，有时要高很多。是否用非参数统计方法，要根据对总体分布的了解程度来确定。,SPSS中的非参数检验方法主要涉及以下方面：单样本非参数检验两独立样本非参数检验多独立样本非参数检验两配对样本非参数检验多配对样本非参数检验,7.2单样本的非参数检验,7.2.1总体分布的卡方检验卡方检验可以根据样本数据，推断总体分布与期望分布或某一理论分布是否存在显著差异，通常适于多项分类值总体分布的分析。H0：样本来自的总体分布与期望分布或某一理论分布无显著差异。理论依据如果从一个随机变量X中随机抽取若干个观察样本，这些观察样本落在X的k个互不相交的子集中的观察频数服从一个多项分布，这个多项分布当k

3、趋于无穷时近似服从卡方分布。,卡方统计量Pearson卡方：如果的概率p值小于显著性水平，则应拒绝H0；否则，不拒绝H0 。例子医学家研究心脏病人猝死人数与日期的关系时发现，一周之中星期一心脏病人猝死者较多，其他日子则基本相当。每天的比例近似为：2.8:1:1:1:1:1:1。现收集到心脏病人死亡日期的样本数据，需要推断其总体分布是否与上述理论分布相吻合。,例: 今有 3 人组成的品茶专家组，对A、B两种不同牌号的茶进行 6 种不同味道的检验。凡专家认为优者被记录下来，如下表。不同牌号的茶提供给专家品尝是随机的。两种不同牌号的茶哪个更好？,H0：F( x )为二项分布,7.2.2二项分布检

4、验现实中很多数据的取值是二值的，例如产品分为合格和不合格等等。将这样的二值分别用0和1表示，如进行n次相同的实验，则出现两类（1或0）的次数可以用离散型随机变量X表示。如X值为1的概率为p，则X为0的概率q为1-p，形成二项分布。通过样本数据检验样本来自的总体是否服从指定的概率值为p的二项分布。H0：样本来自的总体与指定的二项分布无显著差异。,二项分布检验小样本：精确检验方法大样本：近似检验方法如果算得概率p值小于显著性水平，则应拒绝H0；否则，不拒绝H0 。例子产品合格率检验,7.2.3单样本K-S检验利用样本数据推断样本来自的总体是否服从某一理论分布。适用于探索连续型随机变量的分布。H

5、0：样本来自的总体与指定的理论分布（正态分布、均匀分布、指数分布和泊松分布等）无显著差异。例子收集储户调查的样本数据，分析储户总体一次存（取）款金额的分布是否服从正态分布。,基本思路在零假设成立的前提下，计算各样本观测值在理论分布中出现的理论累计概率值F(x)；计算各样本观测值的实际累计概率值S(x)；计算实际累计概率值与理论累计概率值的差D(x)；计算差值序列中的最大绝对值差，即D=max(| S(xi) - F(xi) |)。通常由于实际累计概率为离散值，D修正为 D=max(max(| S(xi) - F(xi) |), max(| S(xi-1) - F(xi-1) |) ) 。D

6、统计量也称为K-S统计量。在小样本下，零假设成立时，D统计量服从Kolmogorov分布；在大样本下，零假设成立时， D统计量近似服从K(x)分布；如概率p值小于显著性水平,则应拒绝H0；否则不拒绝H0 。,警告,经常有人在Kolmogorov-Smirnov检验中，当检验不能拒绝总体分布为某分布时，来“接受”或“证明”该样本来自该分布。这是错误的。比如我们有由1、2、3、4、5五个数目组成的数据，我们分别检验该数据是否是正态分布、均匀分布、Poisson分布或指数分布。结果归纳为下表,Kolmogorov-Smirnov单样本分布检验零假设的分布（渐近双边检验的）p-值正态分布1.000均匀

7、分布0.988Poisson分布1.000指数分布0.806,根据此表，没有足够证据来拒绝任何一个零假设。难道我们可以随意“接受”该总体为其中任一个分布吗？,例：公共交通设施适合性的研究公共汽车到达时间是否服从正态分布。,7.2.4 关于随机性的游程检验(run test),游程检验方法是检验一个取两个值的变量的这两个值的出现是否是随机的。假定下面是由0和1组成的一个这种变量的样本：0 0 0 0 1 1 1 1 1 1 0 0 1 0 1 1 1 0 0 0 0 0 0 0 0其中相同的0（或相同的1）在一起称为一个游程（单独的0或1也算）。这个数据中有4个0组成的游程和3个1组成的游程。

8、一共是R=7个游程。其中0的个数为m=15，而1的个数为n=10。,关于随机性的游程检验（run test）,出现0和1的的这样一个过程可以看成是参数为某未知p的Bernoulli试验。但在给定了m和n之后，在0和1的出现是随机的零假设之下，R的条件分布就和这个参数无关了。根据初等概率论，R的分布可以写成（令N=m+n）,关于随机性的游程检验（run test）,于是就可以算出在零假设下有关R的概率，以及进行有关的检验了。利用上面公式可进行精确检验；也可以利用大样本的渐近分布和利用Monte Carlo方法进行检验。当然，游程检验并不仅仅用于只取两个值的变量，它还可以用于某个连续变量的取值小于

9、某个值及大于该值的个数（类似于0和1的个数）是否随机的问题。看下面例子。,关于随机性的游程检验（run test）,例 (run2.sav): 从某装瓶机出来的30盒化妆品的重量如下（单位克） 71.6 71.0 71.8 70.3 70.5 72.9 71.0 71.0 70.1 71.8 71.9 70.3 70.9 69.3 71.2 67.3 67.6 67.7 67.6 68.1 68.0 67.5 69.8 67.5 69.7 70.0 69.1 70.4 71.0 69.9为了看该装瓶机是否工作正常，首先需要验证是否大于和小于中位数的个数是否是随机的（零假设为这种个数的出现是随机

10、的）。如果把小于中位数的记为0，否则记为1，上面数据变成下面的01序列1 1 1 1 1 1 1 1 0 1 1 1 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 实际计算时，用不着这种变换，计算机会自动处理这个问题的。,7.3 两独立样本的非参数检验,7.3.1 曼-惠特尼U(Mann-Whitney U) 检验用于对两总体分布的比较判断。H0：两组独立样本来自的两总体分布无显著差异基本步骤：将两组样本数据(X1, X2, Xm)和(Y1, Y2, Yn) 混合并按升幂排序，得到每个数据各自的秩Ri。记第一个样本观测值的秩的和为WX而第二个样本秩的和为WY。对秩分别

11、求平均，对两个平均秩的差距比较。如果相差甚远，则此时零假设可能是不成立的。计算(X1, X2, Xm)每个秩优先于(Y1, Y2, Yn) 每个秩的个数U1，以及(Y1, Y2, Yn)每个秩优先于(X1, X2, Xm)每个秩的个数U2，比较U1和U2 。如果相差较大，则应怀疑零假设的真实性。依据计算Wilcoxon W统计量和曼-惠特尼U统计量。,基本步骤（续）：WilcoxonW为：如果mn,WilcoxonW=WY；如果m=n，则WilcoxonW为第一个变量所在样本组的W值。曼-惠特尼U统计量为：U=W-1/2k(k+1)，k为W对应样本组的样本个数。小样本下，U服从曼-惠特尼分布；

12、大样本下，U近似服从正态分布，计算方法是：在小样本下，依据U统计量的概率p值进行决策；在大样本下，则依据Z统计量的概率p值进行决策。,7.3.2 两样本分布的Kolmogorov-Smirnov检验,假定有分别来自两个独立总体的两个样本。要想检验它们背后的总体分布相同的零假设，可以进行两独立样本的Kolmogorov-Smirnov检验。原理完全和单样本情况一样。只不过把检验统计量中零假设的分布换成另一个样本的经验分布即可。假定两个样本的样本量分别为n1和n2，用S1 (X)和S2 (X)分别表示两个样本的累积经验分布函数。再记DjS1 (Xj)-S2 (Xj)。近似正态分布的检验统计量为,7

13、.3.3 两样本Wald-Wolfowitz游程检验,Wald-Wolfowitz游程检验（Wald-Wolfowitz runs test）和Kolmogorov-Smirnov检验都是看两样本代表的总体分布是否类似。但是方法不一样。和单样本的游程问题类似。Wald-Wolfowitz游程检验把两个样本混合之后，按照大小次序排列，同样本的观测值在一起的为一个游程。可以由游程个数R看出两个样本在排序中是否随机出现。,7.3.4 极端反应检验,基本思想将一组样本作为控制样本，另一组样本作为实验样本。以控制样本作为对照，检验实验样本相对于控制样本是否出现极端反应。如有极端反应，则认为两总体分布存在

14、显著差异。分析过程将两组样本混合按升序排序求出控制样本的最小秩Qmin和最大秩Qmax，并计算跨度（Span）：S=Qmax-Qmin+1为消除样本数据中极端值对分析结果的影响，在计算跨度之前按比例去除控制样本中靠近两端的部分样本值，然后在求跨度，得到截头跨度。针对跨度或截头跨度计算H检验统计量，即：,几种检验的比较若研究的是两个祥本是否代表位置（集中趋势）有差异的总体，应选择对这种差异最敏感的检验方法。如U检验， K-S检验（单侧）。在样本容量较大或测量层次较低时，可以采用 U 检验，它是专门揭示位置是否有差异的检验。如果样本容量非常小，或者同分秩较多，不便于应用 U 检验时，K-S检验比

15、 U 检验稍为有效一些。如果研究的是两个样本是否代表任一方面有差异的总体，如位置、离散度、偏斜度等等，可以选用K-S 检验（双侧）、游程检验。若被评价的总体是连续分布的，可选用游程检验或 K- S 检验。一般来说， K-S检验要比游程检验更有效，当数据不满足连续性假定时，它仍然可以适用，只是得到的P值将比应得到的稍大些，也就是说犯第 l 类错误的概率会稍稍增大。,7.4.1 Brown-Mood中位数检验在有数个独立样本的情况，希望知道它们的中位数是否相等。零假设是这些样本所代表的总体的中位数相等。备选假设是这些中位数不全相等。假定有k个总体，ni为第i个样本量；把所有样本量之和记为N。先把从这个k个总体来的样本混合起来排序，找出它们的中位数。再计算每个总体中小于该中位数的观测值个数O1i，i=1,k，和每个总体中大于该中位数的观测值个数O2i，i=1,k。这样就形成了一个由元素Oij组成的2k表。其列总和为ni，i=1,k。,7.4 多个独立样本的非参数检验,两个行总和为各样本小于总中位数的观测值总和：R1O11+O12+ O1k及各样本大于总中位数的观测值总和R2O21+O22+ O2k。用Pearson c2统计量，即,

展开阅读全文