单样本非参数检验

上传人:新** 文档编号:563464476 上传时间:2023-02-11 格式:DOCX 页数:6 大小:15.31KB
返回 下载 相关 举报
单样本非参数检验_第1页
第1页 / 共6页
单样本非参数检验_第2页
第2页 / 共6页
单样本非参数检验_第3页
第3页 / 共6页
单样本非参数检验_第4页
第4页 / 共6页
单样本非参数检验_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《单样本非参数检验》由会员分享,可在线阅读,更多相关《单样本非参数检验(6页珍藏版)》请在金锄头文库上搜索。

1、单样本非参数检验SPSS单样本非参数检验是对单个总体的分布形态等进行推断的方法,其中包括卡方检 验、二项分布检验、K-S检验以及变量值随机性检验等方法。1、总体分布的卡方检验例如,医学家在研究心脏病人猝死人数与日期的关系时发现:一周之中,星期一心脏病 人猝死者较多,其他日子则基本相当。当天的比例近似为2.8:1:1:1:1:1:1。现收集 到心脏病人死亡日期的样本数据,推断其总体分布是否与上述理论分布相吻合。卡方检验方法可以根据样本数据,推断总体分布与期望分布或某一理论分布是否存在显 著差异,是一种吻合性检验,通常适于对有多项分类值的总体分布的分析。它的原假设是: 样本来自得总体分布与期望分布

2、或某一理论分布无差异。2、二项分布检验在生活中有很多数据的取值是二值的,例如,人群可以分成男性和女性,产品可以分成 合格和不合格,学生可以分成三好学生和非三好学生,投掷硬币实验的结果可以分成出现正 面和出现反面等。通常将这样的二值分别用1或0表示。如果进行n次相同的实验,则出 现两类(1或0)的次数可以用离散型随机变量X来描述。如果随机变量X为1的概率设为 P,则随机变量X值为0的概率Q便等于1-P,形成二项分布。SPSS的二项分布检验正是要通过样本数据检验样本来自的总体是否服从指定的概率 为 P 的二项分布,其原假设是:样本来自的总体与指定的二项分布无显著差异。从某产品中随机抽取23个样品进

3、行检测并得到检测结果。用1 表示一级品,用0表示 非一级品。根据抽样结果验证该批产品的一级品率是否为 90%。3、单样本 K-S 检验K-S 检验方法能够利用样本数据推断样本来自的总体是否服从某一理论分布,是一种拟 合优度的检验方法,适用于探索连续型随机变量的分布。例如,收集一批周岁儿童身高的数据,需利用样本数据推断周岁儿童总体的身高是否服 从正态分布。再例如,利用收集的住房状况调查的样本数据,分析家庭人均住房面积是否服 从正态分布。单样本 K-S 检验的原假设是:样本来自得总体与指定的理论分布无显著差异, SPSS 的理论分布主要包括正态分布、均匀分布、指数分布和泊松分布等。4、变量值随机性

4、检验变量值随机性检验通过对样本变量值的分析,实现对总体的变量值出现是否随机进行检 验。例如,在投硬币时,如果以 1 表示出现的是正面,以 0 表示出现的是反面,在进行了 若干次投币后,将会得到一个以 1, 0 组成的变量值序列。这时可能会分析“硬币出现正反面 是否是随机的”这样的问题。变量值随机性检验正是解决这类问题的一个有效方法。它的原假设是:总体变量值出现 是随机的。变量随机性检验的重要依据是游程。所谓游程是样本序列中连续出现相同的变量值的次 数。可以直接理解,如果硬币的正反面出现是随机的,那么在数据序列中,许多个 1 或许 多个0 连续出现的可能性将不太大,同时,1 和0 频繁交叉出现的

5、可能性也会较小。因此, 游程数太大或太小都将表明变量值存在不随机的现象。例:为检验某耐压设备在某段时间内工作是否持续正常,测试并记录下该时间段内各个 时间点上的设备耐压的数据。现采用游程检验方法对这批数据进行分析。如果耐压数据的变 动是随机的,可认为该设备工作一直正常,否则认为该设备有不能正常工作的现象。 编辑本段两独立样本的非参数检验两独立样本的非参数检验是在对总体分布不甚了解的情况下,通过对两组独立样本的分 析来推断样本来自得两个总体的分布等是否存在显著差异的方法。独立样本是指在一个总体 中随机抽样对在另一个总体中随机抽样没有影响的情况下所获得的样本。SPSS中提供了多种两独立样本的非参数

6、检验方法,其中包括曼-惠特尼U检验、K-S 检验、 W-W 游程检验、极端反应检验等。某工厂用甲乙两种不同的工艺生产同一种产品。如果希望检验两种工艺下产品的使用是 否存在显著差异,可从两种工艺生产出的产品中随机抽样,得到各自的使用寿命数据。甲工艺:675 682 692 679 669 661 693乙工艺:662 649 672 663 650 651 646 6521、曼-惠特尼 U 检验两独立样本的曼-惠特尼U检验可用于对两总体分布的比例判断。其原假设:两组独立 样本来自的两总体分布无显著差异。曼-惠特尼U检验通过对两组样本平均秩的研究来实现 判断。秩简单说就是变量值排序的名次,可以将数

7、据按升序排列,每个变量值都会有一个在 整个变量值序列中的位置或名次,这个位置或名次就是变量值的秩。2、K-S检验K-S 检验不仅能够检验单个总体是否服从某一理论分布,还能够检验两总体分布是否存 在显著差异。其原假设是:两组独立样本来自的两总体的分布无显著差异。这里是以变量值的秩作为分析对象,而非变量值本身。3、游程检验单样本游程检验是用来检验变量值的出现是否随机,而两独立变量的游程检验则是用来 检验两独立样本来自的两总体的分布是否存在显著差异。其原假设是:两组独立样本来自的 两总体的分布无显著差异。两独立样本的游程检验与单样本游程检验的思想基本相同,不同的是计算游程数的方 法。两独立样本的游程

8、检验中,游程数依赖于变量的秩。4、极端反应检验极端反应检验从另一个角度检验两独立样本所自得两总体分布是否存在显著差异。其原 假设是:两独立样本来自的两总体的分布无显著差异。基本思想是:将一组样本作为控制样本,另一组样本作为实验样本。以控制样本作为对 照,检验实验样本相对于控制样本是否出现了极端反应。如果实验样本没有出现极端反应, 则认为两总体分布无显著差异,相反则认为存在显著差异。编辑本段多独立样本的非参数检验多独立样本的非参数检验是通过分析多组独立样本数据,推断样本来自的多个总体的中 位数或分布是否存在显著差异。多组独立样本是指按独立抽样方式获得的多组样本。SPSS提供的多独立样本非参数检验

9、的方法主要包括中位数检验、Kruskal-Wallis检验、 Jonckheere-Terpstra 检验。例:希望对北京、上海、成都、广州四个城市的周岁儿童的身高进行比较分析。采用独 立抽样方式获得四组独立样本。1、中位数检验中位数检验通过对多组独立样本的分析,检验它们来自的总体的中位数是否存在显著差 异。其原假设是:多个独立样本来自的多个总体的中位数无显著差异。基本思想是:如果多个总体的中位数无显著差异,或者说多个总体有共同的中位数,那 么这个共同的中位数应在各样本组中均处在中间位置上。于是,每组样本中大于该中位数或 小于该中位数的样本数目应大致相同。2、Kruskal-Wallis 检验

10、Kruskal-Wallis检验实质是两独立样本的曼-惠特尼U检验在多个样本下的推广,也用 于检验多个总体的分布是否存在显著差异。其原假设是:多个独立样本来自的多个总体的分 布无显著差异。基本思想是:首先,将多组样本数据混合并按升序排序,求出各变量值的秩;然后,考 察各组秩的均值是否存在显著差异。容易理解:如果各组秩的均值不存在显著差异,则是多 组数据充分混合,数值相差不大的结果,可以认为多个总体的分布无显著差异;反之,如果 各组秩的均值存在显著差异,则是多组数据无法混合,某些组的数值普遍偏大,另一些组的 数值普遍偏小的结果,可以认为多个总体的分布有显著差异。3、Jonckheere-Terp

11、stra 检验Jonckheere-Terpstra 检验也是用于检验多个独立样本来自的多个总体的分布是否存在 显著差异的非参数检验方法,其原假设是:多个独立样本来自的多个总体的分布无显著差异。基本思想与两独立样本的曼-惠特尼u检验类似,也是计算一组样本的观察值小于其他 组样本的观察值的个数。编辑本段两配对样本的非参数检验两配对样本的非参数检验是对总体分布不甚了解的情况下,通过对两组配对样本的分 析,推断样本来自的两个总体的分布是否存在显著差异的方法。SPSS提供的两配对样本非参数检验的方法主要包括McNemar检验、符号检验、Wilcoxon 符号秩检验等。例:要检验一种新的训练方法是否对提

12、高跳远运动员的成绩有显著效果,可以收集一批 跳远运动员在使用新训练方法前后的跳远最好成绩,这样的两组样本便是配对的。再例如, 分析不同广告形式是否对商品的销售产生显著影响,可以比较几种不同商品在不同广告形式 下的销售额数据(其他条件保持基本稳定)。这里不同广告形式下的若干组商品销售额样本 便是配对样本。可见,配对样本的样本数是相同的,且各样本值的先后次序是不能随意更改 的。1、McNemar 检验是一种变化显著性检验,它将研究对象自身作为对照者检验其“前后”的变化是否显著。 其原假设是:两配对样本来自的两总体的分布无显著差异。分析学生在学习“统计学”课程前后对统计学重要性的认知程度是否发生了显

13、著改变,可 以随机收集一批学生在学习“统计学”之前以及学完以后认为统计学是否重要的样本数据(0 表示“不重要”,1 表示“重要”)。应该看到:两配对样本的 McNemar 检验分析的变量是二值变量。因此,在实际应用中, 如果变量不是二值变量,应首先进行数据转换后方可采用该方法,因而它在应用范围方面有 一定的局限性。2、符号检验符号检验也是用来检验两配对样本所来自的总体的分布是否存在显著差异的非参数方 法。其原假设是:两配对样本来自的两总体的分布无显著差异。首先,分别用第二组样本的各个观察值减去第一组对应样本的观察值。差值为正则记为 正号,差值为负则记为负号。然后,将正号的个数与负号的个数进行比

14、较,容易理解:如果 正号个数和负号个数大致相当,则可以认为第二组样本大于第一组样本变量值的个数,与第 二组样本小于第一组样本的变量值个数是大致相当的,从总体上讲,这两个组配对样本的数 据分布差距较小;相反,如果正号个数和负号个数相差较多,则可以认为两个配对样本的数 据分布差距较大。应该看到:配对样本的符号检验注重对变化方向的分析,只考虑数据变化的性质,即是 变大了还是变小了,但没有考虑变化幅度,即大了多少,小了多少,因而对数据利用是不充 分的。3、Wilcoxon 符号秩检验Wilcoxon 符号秩检验也是通过分析两配对样本,对样本来自的两总体的分布是否存在 差异进行判断。其原假设是:两配对样

15、本来自的两总体的分布无显著差异。基本思想是:首先,按照符号检验的方法,分布用第二组样本的各个观察值减去第一组 对应样本的观察值。差值为正则记为正号,为负则记为负号,并同时保存差值数据;然后,将差值变量按升序排序,并求出差值变量的秩;最后,分布计算正号秩总和W+和负号秩和W-。编辑本段多配对样本的非参数检验多配对样本的非参数检验是通过分析多组配对样本数据,推断样本来自的多个总体的中 位数或分布是否存在显著差异。例如,收集乘客对多家航空公司是否满意的数据,分析航空公司的服务水平是否存在显 著差异;再例如,收集不同促销形式下若干种商品的销售额数据,分析比较不同促销形式的 效果,再如,收集多名评委对同

16、一批歌手比赛打分的数据,分析评委的打分标准是否一致,这些问题都可以通过多配对样本非参数检验方法进行分析。SPSS中的多配对样本的非 参数检验方法主要包括Friedman检验、Cochran Q检验、Kendall协同系数检验等。1、 Friedman 检验Friedman 检验是利用秩实现对多个总体分布是否存在显著差异的非参数检验方法,其 原假设是:多个配对样本来自的多个总体分布无显著差异。SPSS将自动计算Friedman统计量和对应的概率P值。如果概率P值小于给定的显著 性水平0.05,则拒绝原假设,认为各组样本的秩存在显著差异,多个配对样本来自的多个 总体的分布有显著差异;反之,则不能拒绝原假设,可以认为各组样本的秩不存在显著性差 异。基于上述基本思路,多配对样本的

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号