《spss16使用教程第10章非参数检验ppt课件》由会员分享,可在线阅读,更多相关《spss16使用教程第10章非参数检验ppt课件(152页珍藏版)》请在金锄头文库上搜索。
1、SPSS 16实用教程第第10章章 非参数检验非参数检验总体分布的卡方总体分布的卡方Chi-squareChi-square检验检验10.1二项分布检验二项分布检验10.2SPSSSPSS单样本变量值随机性检验单样本变量值随机性检验10.3 SPSS SPSS单样本单样本K-SK-S检验检验10.4两独立样本非参数检验两独立样本非参数检验10.5多独立样本非参数检验多独立样本非参数检验10.6两配对样本非参数检验两配对样本非参数检验10.7多配对样本非参数检验多配对样本非参数检验10.8阅读提示非参数非参数检验用于用于对样本的概率分布状本的概率分布状态的的检验建建议先看先看实例再看理例再看理论
2、实例例1在在15页 前面已经讨论的许多统计分析方法对总体前面已经讨论的许多统计分析方法对总体有特殊的要求,如有特殊的要求,如T T检验要求总体符合正态分检验要求总体符合正态分布,布,F F检验要求误差呈正态分布且各组方差整检验要求误差呈正态分布且各组方差整齐,等等。这些方法常用来估计或检验总体参齐,等等。这些方法常用来估计或检验总体参数,统称为参数检验。数,统称为参数检验。 但许多调查或实验所得的科研数据,其总但许多调查或实验所得的科研数据,其总体分布未知或无法确定。因为有的数据不是来体分布未知或无法确定。因为有的数据不是来自所假定分布的总体,或者数据根本不是来自自所假定分布的总体,或者数据根
3、本不是来自一个总体,还有可能数据因为某种原因被严重一个总体,还有可能数据因为某种原因被严重污染,这样在假定分布的情况下进行推断的做污染,这样在假定分布的情况下进行推断的做法就有可能产生错误的结论。此时人们希望检法就有可能产生错误的结论。此时人们希望检验对一个总体分布形状不必作限制。验对一个总体分布形状不必作限制。 这种不是针对总体参数,而是针对总体的这种不是针对总体参数,而是针对总体的某些一般性假设如总体分布的统计分析方某些一般性假设如总体分布的统计分析方法称非参数检验法称非参数检验Nonparametric TestsNonparametric Tests)。)。非参数检验根据样本数目以及样
4、本之间的关系非参数检验根据样本数目以及样本之间的关系可以分为单样本非参数检验、两独立样本非参可以分为单样本非参数检验、两独立样本非参数检验、多独立样本非参数检验、两配对样本数检验、多独立样本非参数检验、两配对样本非参数检验和多配对样本非参数检验几种。非参数检验和多配对样本非参数检验几种。 本章将介绍总体分布的卡方本章将介绍总体分布的卡方Chi-squareChi-square检验、二项分布检验、二项分布BinomialBinomial检验、单样本检验、单样本K-SK-SKolmogorov-SmirnovKolmogorov-Smirnov检验、单样本变检验、单样本变量值随机性检验量值随机性检
5、验Runs TestRuns Test)、两独立样本)、两独立样本非参数检验、多独立样本非参数检验、两配对非参数检验、多独立样本非参数检验、两配对样本非参数检验、多配对样本非参数检验等样本非参数检验、多配对样本非参数检验等8 8类常用的非参数检验方法。其中前类常用的非参数检验方法。其中前4 4种属于单种属于单样本非参数检验。样本非参数检验。10.1 10.1 总总体分布的卡方体分布的卡方 Chi-squareChi-square 检验检验 在得到一批在得到一批样本数据后,人本数据后,人们往往希望从往往希望从中得到中得到样本所来自的本所来自的总体的分布形体的分布形态是否和某是否和某种特定分布相种
6、特定分布相拟合。合。这可以通可以通过绘制制样本数据本数据直方直方图的方法来的方法来进行粗略的判断。如果需要行粗略的判断。如果需要进行比行比较准确的判断,准确的判断,则需要使用非参数需要使用非参数检验的的方法。其中方法。其中总体分布的卡方体分布的卡方检验也也记为22检验就是一种比就是一种比较好的方法。好的方法。10.1.1 统计学上的定义和计算公式统计学上的定义和计算公式 定义:总体分布的卡方检验适用于配合度定义:总体分布的卡方检验适用于配合度检验,是根据样本数据的实际频数推断总体分检验,是根据样本数据的实际频数推断总体分布与期望分布或理论分布是否有显著差异。它布与期望分布或理论分布是否有显著差
7、异。它的零假设的零假设H0H0:样本来自的总体分布形态和期望:样本来自的总体分布形态和期望分布或某一理论分布没有显著差异。分布或某一理论分布没有显著差异。 因此,总体分布的卡方检验是一种吻合性因此,总体分布的卡方检验是一种吻合性检验,比较适用于一个因素的多项分类数据分检验,比较适用于一个因素的多项分类数据分析。总体分布的卡方检验的数据是实际收集到析。总体分布的卡方检验的数据是实际收集到的样本数据,而非频数数据。的样本数据,而非频数数据。 研究问题研究问题 某地一周内各日患忧郁症的人数分布如表某地一周内各日患忧郁症的人数分布如表10-110-1所示,请检验一周内各日人们忧郁数是否所示,请检验一周
8、内各日人们忧郁数是否满足满足1:1:2:2:1:1:11:1:2:2:1:1:1。10.1.2 SPSS中实现过程中实现过程表表表表10-110-1学生的数学成学生的数学成学生的数学成学生的数学成绩绩周周 日日患患 者者 数数131238370480529624731 实现步骤实现步骤图图10-1 10-1 在菜在菜在菜在菜单单中中中中选择选择“Weight Cases“Weight Cases命令命令命令命令图图10-2 “Weight Cases10-2 “Weight Cases对话对话框框框框图图10-3 10-3 在菜在菜在菜在菜单单中中中中选择选择“Chi-Square“Chi-S
9、quare命令命令命令命令图图10-4 “Chi-Square Test10-4 “Chi-Square Test对话对话框框框框图图10-5 “Chi-Square Test10-5 “Chi-Square Test:OptionsOptions对话对话框框框框 (1 1本例输出结果中有两个表格,其中本例输出结果中有两个表格,其中第一个表格如下。第一个表格如下。10.1.3 结果和讨论结果和讨论(2 2输出的结果文件中第二个表格如下。输出的结果文件中第二个表格如下。10.2 10.2 二二项项分布分布检验检验10.2.1 统计学上的定义和计算公式统计学上的定义和计算公式 现实生活中有很多数据
10、的取值只有两类,现实生活中有很多数据的取值只有两类,如医学中的生与死、患病的有与无、性别中的如医学中的生与死、患病的有与无、性别中的男性和女性、产品的合格与不合格等。从这种男性和女性、产品的合格与不合格等。从这种二分类总体中抽取的所有可能结果,要么是对二分类总体中抽取的所有可能结果,要么是对立分类中的这一类,要么是另一类,其频数分立分类中的这一类,要么是另一类,其频数分布称为二项分布。调用布称为二项分布。调用SPSSSPSS中的二项分布检验中的二项分布检验BinomialBinomial可对样本资料进行二项分布分析。可对样本资料进行二项分布分析。 SPSS SPSS二项分布检验就是根据收集到的
11、样本二项分布检验就是根据收集到的样本数据,推断总体分布是否服从某个指定的二项数据,推断总体分布是否服从某个指定的二项分布。其零假设是分布。其零假设是H0H0:样本来自的总体与所指:样本来自的总体与所指定的某个二项分布不存在显著的差异。定的某个二项分布不存在显著的差异。 SPSS SPSS中的二项分布检验,在样本小于或等中的二项分布检验,在样本小于或等于于3030时,按照计算二项分布概率的公式进行计时,按照计算二项分布概率的公式进行计算;样本数大于算;样本数大于3030时,计算的是时,计算的是Z Z统计量,认统计量,认为在零假设下,为在零假设下,Z Z统计量服从正态分布。统计量服从正态分布。Z
12、Z统计统计量的计算公式如下量的计算公式如下 SPSS SPSS将自将自动计算算Z Z统计量,并量,并给出相出相应的的相伴概率相伴概率值。如果相伴概率小于或等于用。如果相伴概率小于或等于用户的的显著性水平著性水平,则应拒拒绝零假零假设H0H0,认为样本本来自的来自的总体分布形体分布形态与指定的二与指定的二项分布存在分布存在显著差异;如果相伴概率著差异;如果相伴概率值大于大于显著性水平,著性水平,则不能拒不能拒绝零假零假设H0H0,认为样本来自的本来自的总体分布体分布形形态与指定的二与指定的二项分布不存在分布不存在显著差异。著差异。SPSSSPSS二项分布检验的数据是实际收集到的样本二项分布检验的
13、数据是实际收集到的样本数据,而非频数数据。数据,而非频数数据。 研究问题研究问题某地某一时期内出生某地某一时期内出生3535名婴儿,其中女性名婴儿,其中女性1919名名定定Sex=0Sex=0),男性),男性1616名定名定Sex=1Sex=1)。问这个)。问这个地方出生婴儿的性别比例与通常的男女性比例地方出生婴儿的性别比例与通常的男女性比例总体概率约为总体概率约为0.50.5是否不同?数据如表是否不同?数据如表10-10-2 2所示。所示。 10.2.2 SPSS中实现过程中实现过程表表表表10-210-23535名名名名婴婴儿的性儿的性儿的性儿的性别别婴婴 儿儿Sex婴婴 儿儿Sex婴婴
14、儿儿Sex111312512014126131151270411612805117029061180300701903118020032090210330100220340111231350121241 实现步骤实现步骤图图10-6 10-6 在菜在菜在菜在菜单单中中中中选择选择“Binomial Test“Binomial Test命令命令命令命令图图10-7 “Binomial Test10-7 “Binomial Test对话对话框框框框图图10-8 “Binomial Test10-8 “Binomial Test:OptionsOptions对话对话框框框框10.2.3 结果和讨论结
15、果和讨论10.3 SPSS10.3 SPSS单样单样本本变变量量值值随机性随机性检检验验10.3.1 统计学上的定义和计算公式统计学上的定义和计算公式 定义:单样本变量值的随机性检验是对某定义:单样本变量值的随机性检验是对某变量的取值出现是否随机进行检验,也称为游变量的取值出现是否随机进行检验,也称为游程检验程检验RunRun过程)。过程)。 单样本变量值的随机性检验是由单样本变量值的随机性检验是由WaldWald提出提出的,它的零假设为的,它的零假设为H0H0:总体某变量的变量值出:总体某变量的变量值出现是随机的。现是随机的。 单样本变量值的随机性检验通过游程单样本变量值的随机性检验通过游程
16、RunRun数来实现。所谓游程是样本序列中连续数来实现。所谓游程是样本序列中连续出现的变量值的次数。出现的变量值的次数。 在在SPSSSPSS单样本本变量量值的随机性的随机性检验中,中,SPSSSPSS将利用游程构造将利用游程构造Z Z统计量,并依据正量,并依据正态分分布表布表给出出对应的相伴概率的相伴概率值。如果相伴概率小。如果相伴概率小于或等于用于或等于用户的的显著性水平著性水平,则应拒拒绝零假零假设H0H0,认为样本本值的出的出现不是随机的;如果相不是随机的;如果相伴概率伴概率值大于大于显著性水平,著性水平,则不能拒不能拒绝零假零假设H0H0,认为变量量值的出的出现是随机的。是随机的。1
17、0.3.2 SPSS中实现过程中实现过程 研究研究问题 某村某村发生一种地方病,其住生一种地方病,其住户沿一条河排沿一条河排列,列,调查时对发病的住病的住户标记为“1 1”,对非非发病的住病的住户标记为“0 0”,共,共3535户,其取,其取值如表如表10-10-3 3所示。所示。 表表表表10-310-33535名住名住名住名住户发户发病情况病情况病情况病情况住住 户户发发 病病 情情 况况住住 户户发发 病病 情情 况况住住 户户发发 病病 情情 况况1113125120141261311512704116128151170290611803007019131180201320902103
18、30100220340111231350121241 实现步骤实现步骤图图10-9 10-9 在菜在菜在菜在菜单单中中中中选择选择“Runs“Runs命令命令命令命令图图10-10 “Runs Test10-10 “Runs Test对话对话框框框框图图10-11 “Runs Test10-11 “Runs Test:OptionsOptions对话对话框框框框10.3.3 结果和讨论结果和讨论10.4.1 统计学上的定义和计算公式统计学上的定义和计算公式10.4 SPSS10.4 SPSS单样本本K-SK-S检验 定义:单样本定义:单样本K-SK-S检验是以两位前苏联数检验是以两位前苏联数学
19、家学家KolmogorovKolmogorov和和SmirnovSmirnov命名的,也是一种命名的,也是一种拟合优度的非参数检验方法。单样本拟合优度的非参数检验方法。单样本K-SK-S检验检验是利用样本数据推断总体是否服从某一理论分是利用样本数据推断总体是否服从某一理论分布的方法,适用于探索连续型随机变量的分布布的方法,适用于探索连续型随机变量的分布形态。形态。 单样本单样本K-SK-S检验可以将一个变量的实际频检验可以将一个变量的实际频数分布与正态分布数分布与正态分布NormalNormal)、均匀分布)、均匀分布UniformUniform)、泊松分布)、泊松分布PoissonPoiss
20、on)、指数)、指数ExponentialExponential分布进行比较。其零假设分布进行比较。其零假设H0H0为为样本来自的总体与指定的理论分布无显著差异。样本来自的总体与指定的理论分布无显著差异。SPSSSPSS实现实现K-SK-S检验的过程如下:检验的过程如下: (1 1根据样本数据和用户的指定构造出根据样本数据和用户的指定构造出理论分布,查分布表得到相应的理论累计概率理论分布,查分布表得到相应的理论累计概率分布函数;分布函数; SPSS SPSS在在统计中将中将计算算K-SK-S的的Z Z统计量,并依量,并依据据K-SK-S分布表小分布表小样本或正本或正态分布表大分布表大样本本给出
21、出对应的相伴概率的相伴概率值。如果相伴概率小。如果相伴概率小于或等于用于或等于用户的的显著性水平著性水平,则应拒拒绝零假零假设H0H0,认为样本来自的本来自的总体与指定的分布有体与指定的分布有显著差异;如果相伴概率著差异;如果相伴概率值大于大于显著性水平,著性水平,则不能拒不能拒绝零假零假设H0H0,认为样本来自的本来自的总体与指体与指定的分布无定的分布无显著差异。著差异。10.4.2 SPSS中实现过程中实现过程 研究问题研究问题 某地某地144144个周岁儿童身高数据如表个周岁儿童身高数据如表10-410-4所所示,问该地区周岁儿童身高频数是否呈正态分示,问该地区周岁儿童身高频数是否呈正态
22、分布?布? 表表表表10-410-4儿童身高数据儿童身高数据儿童身高数据儿童身高数据身身 高高 区区 间间人人 数数642684697701671207225732474227616782796831 实现步骤实现步骤图图10-12 10-12 在菜在菜在菜在菜单单中中中中选择选择“1-Sample K-S“1-Sample K-S命令命令命令命令图图10-13 “One-Sample Kolmogorov-Smirnov Test10-13 “One-Sample Kolmogorov-Smirnov Test对话对话框框框框图图10-14 “One-Sample K-S10-14 “One
23、-Sample K-S:OptionsOptions对话对话框框框框10.4.3 结果和讨论结果和讨论(1 1本例输出结果如下表所示。本例输出结果如下表所示。10.5.1 统计学上的定义和计算公式统计学上的定义和计算公式10.5 10.5 两独立两独立样样本非参数本非参数检验检验 定义:两独立样本的非参数检验是在对总定义:两独立样本的非参数检验是在对总体分布不很了解的情况下,通过分析样本数据,体分布不很了解的情况下,通过分析样本数据,推断样本来自的两个独立总体分布是否存在显推断样本来自的两个独立总体分布是否存在显著差异。一般用来对两个独立样本的均数、中著差异。一般用来对两个独立样本的均数、中位
24、数、离散趋势、偏度等进行差异比较检验。位数、离散趋势、偏度等进行差异比较检验。两个样本是否独立,主要看在一个总体中抽取两个样本是否独立,主要看在一个总体中抽取样本对另外一个总体中抽取样本有无影响。如样本对另外一个总体中抽取样本有无影响。如果没有影响,则可以认为两个总体是独立的。果没有影响,则可以认为两个总体是独立的。SPSSSPSS提供了提供了4 4种两独立样本的非参数检验方法。种两独立样本的非参数检验方法。1两独立样本的两独立样本的Mann-Whitney U检验检验两独立样本的两独立样本的Mann-Whitney UMann-Whitney U检验的零假设检验的零假设H0H0为样本来自的两
25、独立总体均值没有显著差异。为样本来自的两独立总体均值没有显著差异。两独立样本的两独立样本的Mann-Whitney UMann-Whitney U检验主要通过对检验主要通过对平均秩的研究来实现推断。秩简单地说就是名平均秩的研究来实现推断。秩简单地说就是名次。如果将数据按照升序进行排序,这时每一次。如果将数据按照升序进行排序,这时每一个具体数据都会有一个在整个数据中的位置或个具体数据都会有一个在整个数据中的位置或名次,这就是该数据的秩,数据有多少个,秩名次,这就是该数据的秩,数据有多少个,秩便有多少个。便有多少个。2两独立样本的两独立样本的K-S检验检验两独立样本的两独立样本的K-SK-S检验能
26、够对两独立样本的总检验能够对两独立样本的总体分布情况进行比较。其零假设是体分布情况进行比较。其零假设是H0H0为样本来为样本来自的两独立总体分布没有显著差异。自的两独立总体分布没有显著差异。两独立两独立样本的本的K-SK-S检验实现方法是:首先将两方法是:首先将两组样本数据本数据X1X1,X2X2,XmXm和和Y1Y1,Y2Y2,YnYn混合并按升序排列混合并按升序排列m m和和n n是两是两组样本本的的样本容量),分本容量),分别计算两算两组样本秩的累本秩的累计频率和每个点上的累率和每个点上的累计频率;最后将两个累率;最后将两个累计频率相减,得到差率相减,得到差值序列数据。序列数据。两独立样
27、本的两独立样本的K-SK-S检验将关注差值序列。检验将关注差值序列。SPSSSPSS将自动计算将自动计算K-S ZK-S Z统计量,并依据正态分布表统计量,并依据正态分布表给出对应的相伴概率值。如果相伴概率小于或给出对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平等于用户的显著性水平 ,则应拒绝零假设,则应拒绝零假设H0H0,认为两个样本来自的总体分布有显著差异;,认为两个样本来自的总体分布有显著差异;如果相伴概率值大于显著性水平,则不能拒绝如果相伴概率值大于显著性水平,则不能拒绝零假设零假设H0H0,认为两个样本来自的总体分布无显,认为两个样本来自的总体分布无显著差异。著差异。3两独
28、立样本的游程检验两独立样本的游程检验Wald-Wolfwitz Runs)两独立样本的游程检验用来检验样本来自的两两独立样本的游程检验用来检验样本来自的两独立总体的分布是否存在显著差异。其零假设独立总体的分布是否存在显著差异。其零假设是是H0H0为样本来自的两独立总体分布没有显著差为样本来自的两独立总体分布没有显著差异。异。 样本的游程检验中,计算游程的方法与观样本的游程检验中,计算游程的方法与观察值的秩有关。首先,将两组样本混合并按照察值的秩有关。首先,将两组样本混合并按照升序排列。在数据排序时,两组样本的每个观升序排列。在数据排序时,两组样本的每个观察值对应的样本组标志值序列也随之重新排列
29、,察值对应的样本组标志值序列也随之重新排列,然后对标志值序列按照前面然后对标志值序列按照前面10.310.3节的方法求游节的方法求游程。程。 如果计算出的游程数相对比较小,则说明如果计算出的游程数相对比较小,则说明样本来自的两总体的分布形态存在较大差距;样本来自的两总体的分布形态存在较大差距;如果得到的游程数相对比较大,则说明样本来如果得到的游程数相对比较大,则说明样本来自的两总体的分布形态不存在显著差距。自的两总体的分布形态不存在显著差距。 SPSS SPSS将自动计算游程数得到将自动计算游程数得到Z Z统计量,并统计量,并依据正态分布表给出对应的相伴概率值。如果依据正态分布表给出对应的相伴
30、概率值。如果相伴概率小于或等于用户的显著性水平相伴概率小于或等于用户的显著性水平 ,则,则应拒绝零假设应拒绝零假设H0H0,认为两个样本来自的总体分,认为两个样本来自的总体分布有显著差异;如果相伴概率值大于显著性水布有显著差异;如果相伴概率值大于显著性水平,则不能拒绝零假设平,则不能拒绝零假设H0H0,认为两个样本来自,认为两个样本来自的总体分布无显著差异。的总体分布无显著差异。4两独立样本的极端反应检验两独立样本的极端反应检验Moses Extreme Reactions) 两独立样本的极端反应检验用来检验样本两独立样本的极端反应检验用来检验样本来自的两独立总体的分布是否存在显著差异。来自的
31、两独立总体的分布是否存在显著差异。其零假设其零假设H0H0为样本来自的两独立总体分布没有为样本来自的两独立总体分布没有显著差异。显著差异。 两独立样本的极端反应检验将一个样本作两独立样本的极端反应检验将一个样本作为控制样本,另外一个样本作为实验样本。以为控制样本,另外一个样本作为实验样本。以控制样本作对照,检验实验样本是否存在极端控制样本作对照,检验实验样本是否存在极端反应。首先将两组样本混合并按升序排列;然反应。首先将两组样本混合并按升序排列;然后找出控制样本最低秩和最高秩之间所包含的后找出控制样本最低秩和最高秩之间所包含的观察值个数,即跨度观察值个数,即跨度SpanSpan)。为控制极端值
32、)。为控制极端值对分析结果的影响,也可以先去掉样本两个最对分析结果的影响,也可以先去掉样本两个最极端的观察值后再求跨度,这个跨度称为截头极端的观察值后再求跨度,这个跨度称为截头跨度。跨度。 两独立样本的极端检验计算跨度和截头跨两独立样本的极端检验计算跨度和截头跨度。如果跨度或截头跨度很小,则表明两个样度。如果跨度或截头跨度很小,则表明两个样本数据无法充分混合,可以认为实验样本存在本数据无法充分混合,可以认为实验样本存在极端反应。极端反应。 SPSS SPSS自动计算跨度和截头跨度,依据分布自动计算跨度和截头跨度,依据分布表给出对应的相伴概率值。如果相伴概率小于表给出对应的相伴概率值。如果相伴概
33、率小于或等于用户的显著性水平或等于用户的显著性水平 ,则应拒绝零假设,则应拒绝零假设H0H0,认为两个样本来自的总体分布有显著差异;,认为两个样本来自的总体分布有显著差异;如果相伴概率值大于显著性水平,则不能拒绝如果相伴概率值大于显著性水平,则不能拒绝零假设零假设H0H0,认为两个样本来自的总体分布无显,认为两个样本来自的总体分布无显著差异。著差异。10.5.2 SPSS中实现过程中实现过程 研究问题研究问题 研究两个不同厂家生产的灯泡使用寿命是研究两个不同厂家生产的灯泡使用寿命是否存在显著差异。随机抽取两个厂家生成的灯否存在显著差异。随机抽取两个厂家生成的灯泡若干,实验得到使用寿命,数据如表
34、泡若干,实验得到使用寿命,数据如表10-510-5所所示。示。表表表表10-510-5两个厂家生两个厂家生两个厂家生两个厂家生产产的灯泡使用寿命数据的灯泡使用寿命数据的灯泡使用寿命数据的灯泡使用寿命数据灯泡寿命(灯泡寿命(h)厂厂 家家 编编 号号67516821691167016501693165016492680263026502646265126202 实现步骤实现步骤图图10-15 10-15 在菜在菜在菜在菜单单中中中中选择选择“2 Independent Samples“2 Independent Samples命令命令命令命令图图10-16 “Two-Independent-Sa
35、mples-Test10-16 “Two-Independent-Samples-Test对话对话框框框框 图图10-17 “Two Independent Samples10-17 “Two Independent Samples:Define GroupsDefine Groups对话对话框框框框 图图10-18 “Two-Independent-Samples10-18 “Two-Independent-Samples: Options Options对话对话框框框框10.5.3 结果和讨论结果和讨论 (1 1两独立样本两独立样本Mann-Whitney UMann-Whitney U检
36、验结检验结果如下面两表所示。果如下面两表所示。 (2 2两独立样本两独立样本K-SK-S检验输出结果如下两检验输出结果如下两表所示。表所示。 (3 3两独立样本极端反应检验输出结果两独立样本极端反应检验输出结果如下两表所示。如下两表所示。 (4 4两独立样本游程检验输出结果如下两独立样本游程检验输出结果如下两表所示。两表所示。10.6 10.6 多独立多独立样样本非参数本非参数检验检验10.6.1 统计学上的定义和计算公式统计学上的定义和计算公式 定义:多独立样本非参数检验分析样本数定义:多独立样本非参数检验分析样本数据是推断样本来自的多个独立总体分布是否存据是推断样本来自的多个独立总体分布是
37、否存在显著差异。在显著差异。SPSSSPSS多独立样本非参数检验一般多独立样本非参数检验一般推断多个独立总体的均值或中位数是否存在显推断多个独立总体的均值或中位数是否存在显著差异。著差异。 多个样本之间是否独立,需要看在一个总多个样本之间是否独立,需要看在一个总体中抽取样本对其他总体中抽取样本是否有影体中抽取样本对其他总体中抽取样本是否有影响。如果没有影响,则认为这些总体之间是独响。如果没有影响,则认为这些总体之间是独立的。立的。 例如,随机抽取例如,随机抽取3 3个班级之间学生的学生个班级之间学生的学生成绩,分析成绩,分析3 3个班级总体的成绩是否存在显著个班级总体的成绩是否存在显著的差异。
38、由于对各个班级都是随机抽取样本,的差异。由于对各个班级都是随机抽取样本,抽样没有相互影响,可以认为这三个班级学生抽样没有相互影响,可以认为这三个班级学生成绩是独立的。成绩是独立的。 SPSS SPSS中有中有3 3种多独立样本非参数检验方法。种多独立样本非参数检验方法。1多独立样本的中位数检验多独立样本的中位数检验Median) 多独立样本的中位数检验通过对多组数据多独立样本的中位数检验通过对多组数据的分析推断多个独立总体分布是否存在显著差的分析推断多个独立总体分布是否存在显著差异。多独立样本的中位数检验的零假设异。多独立样本的中位数检验的零假设H0H0为:为:样本来自的多个独立总体的中位数无
39、显著差异。样本来自的多个独立总体的中位数无显著差异。 2多独立样本的多独立样本的K-W检验检验 多独立样本的多独立样本的K-WK-W检验是检验是Kruskal-WaillisKruskal-Waillis检验的缩写,是一种推广的平均秩检验。其零检验的缩写,是一种推广的平均秩检验。其零假设为:样本来自的多个独立总体的分布无显假设为:样本来自的多个独立总体的分布无显著差异。著差异。 多独立样本的多独立样本的K-WK-W检验的基本方法是:首检验的基本方法是:首先将多组样本数混合按升序排列,并求出每个先将多组样本数混合按升序排列,并求出每个观察值的秩,然后对多组样本的秩分别求平均观察值的秩,然后对多组
40、样本的秩分别求平均值。值。 如果各组样本的平均秩大致相等,则可以如果各组样本的平均秩大致相等,则可以认为多个独立总体的分布没有显著差异。如果认为多个独立总体的分布没有显著差异。如果各样本的平均秩相差很大,则不能认为多个独各样本的平均秩相差很大,则不能认为多个独立总体的分布无显著差异。立总体的分布无显著差异。3多独立样本的多独立样本的Jonkheere-Terpstra检检验验 多独立样本的多独立样本的Jonkheere-TerpstraJonkheere-Terpstra检验用检验用于分析样本来自的多个独立总体分布是否存在于分析样本来自的多个独立总体分布是否存在显著差异。其零假设是:样本来自的
41、多个独立显著差异。其零假设是:样本来自的多个独立总体的分布无显著差异。总体的分布无显著差异。 多独立样本的多独立样本的Jonkheere-TerpstraJonkheere-Terpstra检验的检验的基本方法和两独立样本的基本方法和两独立样本的Mann-Whitney UMann-Whitney U检验检验比较类似,也是计算一组样本的观察值小于其比较类似,也是计算一组样本的观察值小于其他组样本观察值的个数。他组样本观察值的个数。 研究问题研究问题 随机抽取随机抽取3 3个班级的学生,得到个班级的学生,得到2121个学生个学生成绩样本,如表成绩样本,如表10-710-7所示,问所示,问3 3个
42、班级学生总个班级学生总体成绩是否存在显著差异?体成绩是否存在显著差异? 10.6.2 SPSS中实现过程中实现过程表表表表10-710-73 3个班个班个班个班级级学生成学生成学生成学生成绩绩学学 生生 成成 绩绩所所 属属 班班 级级学学 生生 成成 绩绩所所 属属 班班 级级60.00190.00270.00196.00271.00170.00280.00185.00375.00192.00365.00197.00390.00196.00380.00288.00385.00289.00381.00280.00383.002 实现步骤实现步骤图图10-19 10-19 在菜在菜在菜在菜单单中
43、中中中选择选择“K Independent Samples“K Independent Samples命令命令命令命令 图图10-20 “Tests for Several Independent Samples10-20 “Tests for Several Independent Samples对话对话框框框框图图10-21 “Several Independent Samples10-21 “Several Independent Samples:Define RangeDefine Range对话对话框框框框 图图10-22 “Two-Independent-Samples10-22
44、“Two-Independent-Samples: Options Options对话对话框框框框10.6.3 结果和讨论结果和讨论(1 1多独立样本多独立样本K-WK-W检验结果如下两表所示。检验结果如下两表所示。 (2 2多独立样本中位数检验结果如下两多独立样本中位数检验结果如下两表所示。表所示。10.7 10.7 两配两配对样对样本非参数本非参数检验检验10.7.1 统计学上的定义和计算公式统计学上的定义和计算公式 定义:两配对样本定义:两配对样本2 Related Samples2 Related Samples非参数检验是在对总体分布不很清楚的情况非参数检验是在对总体分布不很清楚的情
45、况下,对样本来自的两相关配对总体分别进行检下,对样本来自的两相关配对总体分别进行检验。验。 两配对样本非参数检验一般用于同一研究两配对样本非参数检验一般用于同一研究对象或两配对对象分别给予两种不同处理对象或两配对对象分别给予两种不同处理的效果比较,以及同一研究对象或两配对对的效果比较,以及同一研究对象或两配对对象处理前后的效果比较。前者推断两种效果象处理前后的效果比较。前者推断两种效果有无差别,后者推断某种处理是否有效。有无差别,后者推断某种处理是否有效。 两配对样本非参数检验的前提要求两个样两配对样本非参数检验的前提要求两个样本应是配对的。在应用领域中,主要的配对资本应是配对的。在应用领域中
46、,主要的配对资料包括:具有年龄、性别、体重、病况等非处料包括:具有年龄、性别、体重、病况等非处理因素相同或相似者。首先两个样本的观察数理因素相同或相似者。首先两个样本的观察数目相同,其次两样本的观察值顺序不能随意改目相同,其次两样本的观察值顺序不能随意改变。变。 SPSS SPSS中有以下中有以下3 3种两配对样本非参数检验种两配对样本非参数检验方法。方法。1两配对样本的两配对样本的McNemar变化显著变化显著性检验性检验 McNemar McNemar变化显著性检验以研究对象自身变化显著性检验以研究对象自身为对照,检验其两组样本变化是否显著。其零为对照,检验其两组样本变化是否显著。其零假设
47、为:样本来自的两配对总体分布无显著差假设为:样本来自的两配对总体分布无显著差异。异。 McNemar McNemar变化显著性检验要求待检验的两变化显著性检验要求待检验的两组样本的观察值是二值数据,在实际分析中有组样本的观察值是二值数据,在实际分析中有一定的局限性。一定的局限性。 McNemar McNemar变化显著性检验基本方法采用二变化显著性检验基本方法采用二项分布检验。它通过对两组样本前后变化的频项分布检验。它通过对两组样本前后变化的频率,计算二项分布的概率值。率,计算二项分布的概率值。 2两配对样本的符号两配对样本的符号Sign检验检验 当两配对样本的观察值不是二值数据时,当两配对样
48、本的观察值不是二值数据时,无法利用前面一种检验方法,这时可以采用两无法利用前面一种检验方法,这时可以采用两配对样本的符号配对样本的符号SignSign检验方法。其零假设检验方法。其零假设为:样本来自的两配对样本总体的分布无显著为:样本来自的两配对样本总体的分布无显著差异。差异。 两配对样本的符号检验利用正、负符号的两配对样本的符号检验利用正、负符号的个数多少来进行检验。首先,将第二组样本的个数多少来进行检验。首先,将第二组样本的各个观察值减去第一组样本对应的观察值,如各个观察值减去第一组样本对应的观察值,如果得到差值是一个正数,则记为正号;差值为果得到差值是一个正数,则记为正号;差值为负数,则
49、记为负号。然后计算正号的个数和负负数,则记为负号。然后计算正号的个数和负号的个数。号的个数。 通过比较正号的个数和负号的个数,可以通过比较正号的个数和负号的个数,可以判断两组样本的分布。例如,正号的个数和负判断两组样本的分布。例如,正号的个数和负号的个数大致相当,则可以认为两配对样本数号的个数大致相当,则可以认为两配对样本数据分布差距较小;正号的个数和负号的个数相据分布差距较小;正号的个数和负号的个数相差较多,可以分为两配对样本数据分布差距较差较多,可以分为两配对样本数据分布差距较大。大。 SPSS SPSS将自动对差值正负符合序列作单样本将自动对差值正负符合序列作单样本二项分布检验,计算出实
50、际的概率值。如果得二项分布检验,计算出实际的概率值。如果得到的概率值小于或等于用户的显著性水平到的概率值小于或等于用户的显著性水平 ,则应拒绝零假设则应拒绝零假设H0H0,认为两配对样本来自的总,认为两配对样本来自的总体分布有显著差异;如果概率值大于显著性水体分布有显著差异;如果概率值大于显著性水平,则不能拒绝零假设平,则不能拒绝零假设H0H0,认为两配对样本来,认为两配对样本来自的总体分布无显著差异。自的总体分布无显著差异。3两配对样本的两配对样本的Wilcoxon符号平均秩符号平均秩检验检验 两配对样本的符号检验考虑了总体数据变两配对样本的符号检验考虑了总体数据变化的性质,但没有考虑两组样
51、本变化的程度。化的性质,但没有考虑两组样本变化的程度。两配对样本的两配对样本的WilcoxonWilcoxon符号平均秩检验考虑了符号平均秩检验考虑了这方面的因素。其零假设为:样本来自的两配这方面的因素。其零假设为:样本来自的两配对样本总体的分布无显著差异。对样本总体的分布无显著差异。 两配两配对样本的本的WilcoxonWilcoxon符号平均秩符号平均秩检验首首先按照符号先按照符号检验的方法,将第二的方法,将第二组样本的各个本的各个观察察值减去第一减去第一组样本本对应的的观察察值,如果得,如果得到差到差值是一个正数,是一个正数,则记为正号;差正号;差值为负数,数,则记为负号。同号。同时保存
52、差保存差值的的绝对值数据。然数据。然后将后将绝对差差值数据按升序排序,并求出相数据按升序排序,并求出相应的的秩,最后分秩,最后分别计算正号秩算正号秩总合合W W+ +、负号秩号秩总合合W W以及正号平均秩和以及正号平均秩和负号平均秩。号平均秩。 如果正号平均秩和负号平均秩大致相当,如果正号平均秩和负号平均秩大致相当,则可以认为两配对样本数据正负变化程度基本则可以认为两配对样本数据正负变化程度基本相当,分布差距较小。相当,分布差距较小。 两配对样本的两配对样本的WilcoxonWilcoxon符号平均秩检验按符号平均秩检验按照下面的公式计算照下面的公式计算Z Z统计量,它近似服从正态统计量,它近
53、似服从正态分布分布 研究问题研究问题 分析分析1010个学生接受某种方法进行训练的效个学生接受某种方法进行训练的效果,收集到这些学生在训练前、后的成绩,如果,收集到这些学生在训练前、后的成绩,如表表10-910-9所示。表格的每一行表示一个学生的所示。表格的每一行表示一个学生的4 4个成绩。其中第一列表示,训练前的成绩是否个成绩。其中第一列表示,训练前的成绩是否合格,合格,0 0表示不合格,表示不合格,1 1表示合格;第二列表示表示合格;第二列表示训练后的成绩是否合格,训练后的成绩是否合格,0 0表示不合格,表示不合格,1 1表示表示合格;第三列表示训练前学生的具体成绩;第合格;第三列表示训练
54、前学生的具体成绩;第四列表示训练后学生的具体成绩。问训练前后四列表示训练后学生的具体成绩。问训练前后学生的成绩是否存在显著差异?学生的成绩是否存在显著差异? 10.7.2 SPSS中实现过程中实现过程表表表表10-910-9训练训练前后的成前后的成前后的成前后的成绩绩训练前训练前训练后训练后训练前成绩训练前成绩训练后成绩训练后成绩0158.0070.001170.0071.000145.0065.000156.0068.000045.0050.000050.0055.001161.0075.001170.0070.000155.0065.001160.0070.00 实现步骤实现步骤图图10-
55、23 10-23 在菜在菜在菜在菜单单中中中中选择选择“2 Related Samples“2 Related Samples命令命令命令命令图图10-24 “Two-Related-Samples Tests10-24 “Two-Related-Samples Tests对话对话框框框框图图10-25 10-25 选择选择两个两个两个两个变变量配量配量配量配对对图图10-26 “Two-Related-Samples10-26 “Two-Related-Samples:OptionsOptions对话对话框框框框图图10-27 10-27 选择选择两个两个两个两个变变量配量配量配量配对对10
56、.7.3 结果和讨论结果和讨论(1 1描述性统计部分结果如下表所示。描述性统计部分结果如下表所示。(2 2WilcoxonWilcoxon检验结果如下两表所示。检验结果如下两表所示。(3 3符号检验结果如下两表所示。符号检验结果如下两表所示。(4 4McNemarMcNemar检验结果如下两表所示。检验结果如下两表所示。10.8 10.8 多配多配对样对样本非参数本非参数检验检验10.8.1 统计学上的定义和计算公式统计学上的定义和计算公式 定义:多配对样本非参数检验是对多个匹定义:多配对样本非参数检验是对多个匹配样本的总体分布是否存在显著性差异进行统配样本的总体分布是否存在显著性差异进行统计
57、分析。计分析。 SPSS SPSS中有以下中有以下3 3种多配对样本非参数检验种多配对样本非参数检验方法。方法。 1多配对样本的多配对样本的Friendman检验检验 多配对样本的多配对样本的FriendmanFriendman检验是利用秩实检验是利用秩实现多个配对总体分布检验的一种方法,多配对现多个配对总体分布检验的一种方法,多配对样本的样本的FriendmanFriendman检验要求数据是定距的。其检验要求数据是定距的。其零假设为:样本来自的多个配对总体的分布无零假设为:样本来自的多个配对总体的分布无显著差异。显著差异。 多配对样本的多配对样本的FriendmanFriendman检验的
58、实现原理检验的实现原理是:首先以样本为单位,将各个样本数据按照是:首先以样本为单位,将各个样本数据按照升序排列,求得各个样本数据在各自行中的秩,升序排列,求得各个样本数据在各自行中的秩,然后计算各样本的秩总和及平均秩。然后计算各样本的秩总和及平均秩。 如果多个配对样本的分布存在显著的差异,如果多个配对样本的分布存在显著的差异,那么数值普遍偏大的组秩和必然偏大,数值普那么数值普遍偏大的组秩和必然偏大,数值普遍偏小的组,秩和也必然偏小,各组的秩之间遍偏小的组,秩和也必然偏小,各组的秩之间就会存在显著差异。如果各样本的平均秩大致就会存在显著差异。如果各样本的平均秩大致相当,那么可以认为各组的总体分布
59、相当,那么可以认为各组的总体分布 没有显没有显著差异。著差异。2多配对样本的多配对样本的Kendall协同系数检验协同系数检验 多配对样本的多配对样本的KendallKendall协同系数检验和协同系数检验和FriedmanFriedman检验非常类似,也是一种多配对样本检验非常类似,也是一种多配对样本的非参数检验,但分析的角度不同。多配对样的非参数检验,但分析的角度不同。多配对样本的本的KendallKendall协同系数检验主要用在分析评判协同系数检验主要用在分析评判者的判别标准是否一致公平方面。它将每个评者的判别标准是否一致公平方面。它将每个评判对象的分数都看作是来自多个配对总体的样判对
60、象的分数都看作是来自多个配对总体的样本。一个评判对象对不同被判定对象的分数构本。一个评判对象对不同被判定对象的分数构成一个样本,其零假设为:样本来自的多个配成一个样本,其零假设为:样本来自的多个配对总体的分布无显著差异,即评判者的评判标对总体的分布无显著差异,即评判者的评判标准不一致。准不一致。 Kendall Kendall协同系数检验中会计算协同系数检验中会计算FriedmanFriedman检验方法,得到检验方法,得到friedmanfriedman统计量和相伴概率。统计量和相伴概率。如果相伴概率小于显著性水平,可以认为这如果相伴概率小于显著性水平,可以认为这1010个节目之间没有显著差
61、异,那么可以认为这个节目之间没有显著差异,那么可以认为这5 5个评委判定标准不一致,也就是判定结果不一个评委判定标准不一致,也就是判定结果不一致。致。3多配对样本的多配对样本的Cochran Q检验检验 多配对样本的多配对样本的Cochran QCochran Q检验也是对多个检验也是对多个互相匹配样本总体分布是否存在显著性差异的互相匹配样本总体分布是否存在显著性差异的统计检验。不同的是多配对样本的统计检验。不同的是多配对样本的Cochran QCochran Q检验所能处理的数据是二值的检验所能处理的数据是二值的0 0和和1 1)。其零)。其零假设是:样本来自的多配对总体分布无显著差假设是:
62、样本来自的多配对总体分布无显著差异。异。10.8.2 SPSS中实现过程中实现过程 研究问题研究问题1 1 为了试验某种减肥药的性能,测量为了试验某种减肥药的性能,测量1010个人个人在服用该药前以及服用该药一个月后、两个月在服用该药前以及服用该药一个月后、两个月后、后、3 3个月后的体重。问在这个月后的体重。问在这4 4个时期,个时期,1010个人个人的体重有无发生显著的变化。数据如表的体重有无发生显著的变化。数据如表10-1010-10所示。所示。表表表表10-1010-104 4个个个个时时期的体重期的体重期的体重期的体重kgkg)pre_1post_1post_2post_380.00
63、80.0070.0069.0079.0075.0071.0070.0085.0080.0075.0075.0080.0075.0068.0070.0075.0075.0074.0070.0074.0074.0070.0069.0065.0065.0063.0061.0070.0070.0070.0070.0080.0070.0065.0065.0075.0072.0070.0060.0080.0080.0070.0069.00 实现步骤实现步骤图图10-28 10-28 在菜在菜在菜在菜单单中中中中选择选择“K Related Samples“K Related Samples命令命令命令命令
64、图图10-29 “Tests for Serveral Related Samples10-29 “Tests for Serveral Related Samples对话对话框一)框一)框一)框一)图图10-30 “Several Related Samples10-30 “Several Related Samples:StatisticsStatistics对话对话框一)框一)框一)框一) 研究问题研究问题2 2 某文艺晚会中有某文艺晚会中有5 5个节目,共有个节目,共有5 5个评委参个评委参与打分。问这与打分。问这5 5个评委的判断标准是否一致。个评委的判断标准是否一致。数据如表数据如
65、表10-1110-11所示。所示。表表表表10-1110-115 5个个个个评评委的打分表委的打分表委的打分表委的打分表节 目 1节 目 2节 目 3节 目 4节 目 5评委18.758.258.809.008.50评委210.009.509.508.909.50评委39.609.109.108.509.60评委49.208.508.909.109.40评委59.659.209.109.108.90 实现步骤实现步骤图图10-31 “Tests for Serveral Related Samples10-31 “Tests for Serveral Related Samples对话对话框二
66、)框二)框二)框二)图图10-32 “Several Related Samples10-32 “Several Related Samples:StatisticsStatistics对话对话框二)框二)框二)框二) 研究问题研究问题3 3 消费者协会调查了顾客对消费者协会调查了顾客对3 3种品牌的电视种品牌的电视机的满意程度,共有机的满意程度,共有1010个顾客参与了满意度调个顾客参与了满意度调查。数据如表查。数据如表10-1210-12所示。所示。表表表表10-1210-12顾顾客的客的客的客的满满意度表格意度表格意度表格意度表格品品 牌牌 1品品 牌牌 2品品 牌牌 3顾客顾客1满意满
67、意不满意不满意不满意不满意顾客顾客2满意满意满意满意满意满意顾客顾客3不满意不满意不满意不满意不满意不满意顾客顾客4满意满意满意满意满意满意顾客顾客5满意满意满意满意不满意不满意顾客顾客6满意满意满意满意不满意不满意顾客顾客7满意满意不满意不满意满意满意顾客顾客8满意满意满意满意满意满意顾客顾客9满意满意满意满意不满意不满意顾客顾客10满意满意不满意不满意满意满意 实现步骤实现步骤图图10-33 “Tests for Serveral Related Samples10-33 “Tests for Serveral Related Samples对话对话框三)框三)框三)框三)10.8.3 结
68、果和讨论结果和讨论(1 1多配对样本的多配对样本的FriendmanFriendman检验检验 (2 2多配对样本的多配对样本的KendallKendall协同系数检验,协同系数检验,描述性统计部分结果表格如下。描述性统计部分结果表格如下。 (3 3多配对样本的多配对样本的Cochran QCochran Q检验结果如检验结果如下两表所示。下两表所示。小小 结结 非参数检验主要用于那些总体分布不能用非参数检验主要用于那些总体分布不能用有限个实参数来刻画,或者不考虑被研究的对有限个实参数来刻画,或者不考虑被研究的对象为何种分布以及是否已知的情况。这种方法象为何种分布以及是否已知的情况。这种方法进
69、行的并不是参数间的比较,而是分布位置、进行的并不是参数间的比较,而是分布位置、分布形状之间的比较,研究目标总体与理论总分布形状之间的比较,研究目标总体与理论总体分布是否相同,或者各样本所在总体的分布体分布是否相同,或者各样本所在总体的分布位置是否相同等。位置是否相同等。小小 结结 非参数检验根据样本数目以及样本之间的非参数检验根据样本数目以及样本之间的关系可以分为:单样本非参数检验、两独立样关系可以分为:单样本非参数检验、两独立样本非参数检验、多独立样本非参数检验、两配本非参数检验、多独立样本非参数检验、两配对样本非参数检验、多配对样本非参数检验等。对样本非参数检验、多配对样本非参数检验等。小
70、小 结结 SPSS SPSS中中“AnalyzeAnalyze”/ /“Nonparametric TestsNonparametric Tests菜菜单主要用于非参数主要用于非参数检验。其中,。其中,单样本非本非参数参数检验由由“1 1Sample K-SSample K-S子菜子菜单来来执行;行;两独立两独立样本非参数本非参数检验由由“2 Independent 2 Independent SamplesSamples子菜子菜单执行;多独立行;多独立样本非参数本非参数检验由由“K Independent SamplesK Independent Samples子菜子菜单执行;行;两配两配对样本非参数本非参数检验由由“2 Related Samples2 Related Samples子菜子菜单执行;多配行;多配对样本非参数本非参数检验由由“K K Related SamplesRelated Samples子菜子菜单执行。行。