SPSS教程非参数监测－金锄头文库

资源描述

《SPSS教程非参数监测》由会员分享，可在线阅读，更多相关《SPSS教程非参数监测（151页珍藏版）》请在金锄头文库上搜索。

1、SPSS16实用教程第10章非参数检验前面已经讨论的许多统计分析方法对总体有特殊的要求如T检验要求总体符合正态分布 F检验要求误差呈正态分布且各组方差整齐等等这些方法常用来估计或检验总体参数统称为参数检验但许多调查或实验所得的科研数据其总体分布未知或无法确定因为有的数据不是来自所假定分布的总体或者数据根本不是来自一个总体还有可能数据因为某种原因被严重污染这样在假定分布的情况下进行推断的做法就有可能产生错误的结论此时人们希望检验对一个总体分布形状不必作限制这种不是针对总体参数而是针对总体的某些一般性假设如总体分布的统计分析方法称非参数检验 Nonparametr

2、icTests 非参数检验根据样本数目以及样本之间的关系可以分为单样本非参数检验两独立样本非参数检验多独立样本非参数检验两配对样本非参数检验和多配对样本非参数检验几种本章将介绍总体分布的卡方 Chi square 检验二项分布 Binomial 检验单样本K S Kolmogorov Smirnov 检验单样本变量值随机性检验 RunsTest 两独立样本非参数检验多独立样本非参数检验两配对样本非参数检验多配对样本非参数检验等8类常用的非参数检验方法其中前4种属于单样本非参数检验 10 1总体分布的卡方 Chi square 检验在得到一批样本数据后人们往往希望从中得

3、到样本所来自的总体的分布形态是否和某种特定分布相拟合这可以通过绘制样本数据直方图的方法来进行粗略的判断如果需要进行比较准确的判断则需要使用非参数检验的方法其中总体分布的卡方检验也记为 2检验就是一种比较好的方法 10 1 1统计学上的定义和计算公式定义总体分布的卡方检验适用于配合度检验是根据样本数据的实际频数推断总体分布与期望分布或理论分布是否有显著差异它的零假设H0 样本来自的总体分布形态和期望分布或某一理论分布没有显著差异因此总体分布的卡方检验是一种吻合性检验比较适用于一个因素的多项分类数据分析总体分布的卡方检验的数据是实际收集到的样本数据而非频数数据研究问

4、题某地一周内各日患忧郁症的人数分布如表10 1所示请检验一周内各日人们忧郁数是否满足1 1 2 2 1 1 1 10 1 2SPSS中实现过程表10 1学生的数学成绩实现步骤图10 1在菜单中选择 WeightCases 命令图10 2 WeightCases 对话框图10 3在菜单中选择 Chi Square 命令图10 4 Chi SquareTest 对话框图10 5 Chi SquareTest Options 对话框 1 本例输出结果中有两个表格其中第一个表格如下 10 1 3结果和讨论 2 输出的结果文件中第二个表格如下 10 2二项分布检验 10 2 1统计学上

5、的定义和计算公式现实生活中有很多数据的取值只有两类如医学中的生与死患病的有与无性别中的男性和女性产品的合格与不合格等从这种二分类总体中抽取的所有可能结果要么是对立分类中的这一类要么是另一类其频数分布称为二项分布调用SPSS中的二项分布检验 Binomial 可对样本资料进行二项分布分析 SPSS二项分布检验就是根据收集到的样本数据推断总体分布是否服从某个指定的二项分布其零假设是H0 样本来自的总体与所指定的某个二项分布不存在显著的差异 SPSS中的二项分布检验在样本小于或等于30时按照计算二项分布概率的公式进行计算样本数大于30时计算的是Z统计量认为在零假设下

6、 Z统计量服从正态分布 Z统计量的计算公式如下 SPSS将自动计算Z统计量并给出相应的相伴概率值如果相伴概率小于或等于用户的显著性水平则应拒绝零假设H0 认为样本来自的总体分布形态与指定的二项分布存在显著差异如果相伴概率值大于显著性水平则不能拒绝零假设H0 认为样本来自的总体分布形态与指定的二项分布不存在显著差异 SPSS二项分布检验的数据是实际收集到的样本数据而非频数数据研究问题某地某一时期内出生35名婴儿其中女性19名定Sex 0 男性16名定Sex 1 问这个地方出生婴儿的性别比例与通常的男女性比例总体概率约为0 5 是否不同数据如表10 2所示 10 2 2SP

7、SS中实现过程表10 235名婴儿的性别实现步骤图10 6在菜单中选择 BinomialTest 命令图10 7 BinomialTest 对话框图10 8 BinomialTest Options 对话框 10 2 3结果和讨论 10 3SPSS单样本变量值随机性检验 10 3 1统计学上的定义和计算公式定义单样本变量值的随机性检验是对某变量的取值出现是否随机进行检验也称为游程检验 Run过程单样本变量值的随机性检验是由Wald提出的它的零假设为H0 总体某变量的变量值出现是随机的单样本变量值的随机性检验通过游程 Run 数来实现所谓游程是样本序列中连续出现的变量值的

8、次数在SPSS单样本变量值的随机性检验中 SPSS将利用游程构造Z统计量并依据正态分布表给出对应的相伴概率值如果相伴概率小于或等于用户的显著性水平则应拒绝零假设H0 认为样本值的出现不是随机的如果相伴概率值大于显著性水平则不能拒绝零假设H0 认为变量值的出现是随机的 10 3 2SPSS中实现过程研究问题某村发生一种地方病其住户沿一条河排列调查时对发病的住户标记为 1 对非发病的住户标记为 0 共35户其取值如表10 3所示表10 335名住户发病情况实现步骤图10 9在菜单中选择 Runs 命令图10 10 RunsTest 对话框图10 11 RunsTest

9、 Options 对话框 10 3 3结果和讨论 10 4 1统计学上的定义和计算公式 10 4SPSS单样本K S检验定义单样本K S检验是以两位前苏联数学家Kolmogorov和Smirnov命名的也是一种拟合优度的非参数检验方法单样本K S检验是利用样本数据推断总体是否服从某一理论分布的方法适用于探索连续型随机变量的分布形态单样本K S检验可以将一个变量的实际频数分布与正态分布 Normal 均匀分布 Uniform 泊松分布 Poisson 指数 Exponential 分布进行比较其零假设H0为样本来自的总体与指定的理论分布无显著差异 SPSS实现K S检验的过程如下

10、1 根据样本数据和用户的指定构造出理论分布查分布表得到相应的理论累计概率分布函数 SPSS在统计中将计算K S的Z统计量并依据K S分布表小样本或正态分布表大样本给出对应的相伴概率值如果相伴概率小于或等于用户的显著性水平则应拒绝零假设H0 认为样本来自的总体与指定的分布有显著差异如果相伴概率值大于显著性水平则不能拒绝零假设H0 认为样本来自的总体与指定的分布无显著差异 10 4 2SPSS中实现过程研究问题某地144个周岁儿童身高数据如表10 4所示问该地区周岁儿童身高频数是否呈正态分布表10 4儿童身高数据实现步骤图10 12在菜单中选择 1 SampleK S

11、命令图10 13 One SampleKolmogorov SmirnovTest 对话框图10 14 One SampleK S Options 对话框 10 4 3结果和讨论 1 本例输出结果如下表所示 10 5 1统计学上的定义和计算公式 10 5两独立样本非参数检验定义两独立样本的非参数检验是在对总体分布不很了解的情况下通过分析样本数据推断样本来自的两个独立总体分布是否存在显著差异一般用来对两个独立样本的均数中位数离散趋势偏度等进行差异比较检验两个样本是否独立主要看在一个总体中抽取样本对另外一个总体中抽取样本有无影响如果没有影响则可以认为两个总体是独立的

12、SPSS提供了4种两独立样本的非参数检验方法 1 两独立样本的Mann WhitneyU检验两独立样本的Mann WhitneyU检验的零假设H0为样本来自的两独立总体均值没有显著差异两独立样本的Mann WhitneyU检验主要通过对平均秩的研究来实现推断秩简单地说就是名次如果将数据按照升序进行排序这时每一个具体数据都会有一个在整个数据中的位置或名次这就是该数据的秩数据有多少个秩便有多少个 2 两独立样本的K S检验两独立样本的K S检验能够对两独立样本的总体分布情况进行比较其零假设是H0为样本来自的两独立总体分布没有显著差异两独立样本的K S检验实现方法是首先将两组

13、样本数据 X1 X2 Xm 和 Y1 Y2 Yn 混合并按升序排列 m和n是两组样本的样本容量分别计算两组样本秩的累计频率和每个点上的累计频率最后将两个累计频率相减得到差值序列数据两独立样本的K S检验将关注差值序列 SPSS将自动计算K SZ统计量并依据正态分布表给出对应的相伴概率值如果相伴概率小于或等于用户的显著性水平则应拒绝零假设H0 认为两个样本来自的总体分布有显著差异如果相伴概率值大于显著性水平则不能拒绝零假设H0 认为两个样本来自的总体分布无显著差异 3 两独立样本的游程检验 Wald WolfwitzRuns 两独立样本的游程检验用来检验样本来自的两独立总体的分

14、布是否存在显著差异其零假设是H0为样本来自的两独立总体分布没有显著差异样本的游程检验中计算游程的方法与观察值的秩有关首先将两组样本混合并按照升序排列在数据排序时两组样本的每个观察值对应的样本组标志值序列也随之重新排列然后对标志值序列按照前面10 3节的方法求游程如果计算出的游程数相对比较小则说明样本来自的两总体的分布形态存在较大差距如果得到的游程数相对比较大则说明样本来自的两总体的分布形态不存在显著差距 SPSS将自动计算游程数得到Z统计量并依据正态分布表给出对应的相伴概率值如果相伴概率小于或等于用户的显著性水平则应拒绝零假设H0 认为两个样本来自的总体分布有显著

15、差异如果相伴概率值大于显著性水平则不能拒绝零假设H0 认为两个样本来自的总体分布无显著差异 4 两独立样本的极端反应检验 MosesExtremeReactions 两独立样本的极端反应检验用来检验样本来自的两独立总体的分布是否存在显著差异其零假设H0为样本来自的两独立总体分布没有显著差异两独立样本的极端反应检验将一个样本作为控制样本另外一个样本作为实验样本以控制样本作对照检验实验样本是否存在极端反应首先将两组样本混合并按升序排列然后找出控制样本最低秩和最高秩之间所包含的观察值个数即跨度 Span 为控制极端值对分析结果的影响也可以先去掉样本两个最极端的观察值后再求跨度

16、这个跨度称为截头跨度两独立样本的极端检验计算跨度和截头跨度如果跨度或截头跨度很小则表明两个样本数据无法充分混合可以认为实验样本存在极端反应 SPSS自动计算跨度和截头跨度依据分布表给出对应的相伴概率值如果相伴概率小于或等于用户的显著性水平则应拒绝零假设H0 认为两个样本来自的总体分布有显著差异如果相伴概率值大于显著性水平则不能拒绝零假设H0 认为两个样本来自的总体分布无显著差异 10 5 2SPSS中实现过程研究问题研究两个不同厂家生产的灯泡使用寿命是否存在显著差异随机抽取两个厂家生成的灯泡若干实验得到使用寿命数据如表10 5所示表10 5两个厂家生产的灯泡使用寿命数据实现步骤图10 15在菜单中选择 2IndependentSamples 命令图10 16 Two Independent Samples Test 对话框图10 17 TwoIndependentSamples DefineGroups 对话框图10 18 Two Independent Samples Options 对话框 10 5 3结果和讨论 1 两独立样本Mann Whi

展开阅读全文

SPSS教程 非参数监测

最新文档

SPSS教程非参数监测