基于秩次的非参数检验

上传人:飞*** 文档编号:40594038 上传时间:2018-05-26 格式:DOC 页数:11 大小:95.50KB
返回 下载 相关 举报
基于秩次的非参数检验_第1页
第1页 / 共11页
基于秩次的非参数检验_第2页
第2页 / 共11页
基于秩次的非参数检验_第3页
第3页 / 共11页
基于秩次的非参数检验_第4页
第4页 / 共11页
基于秩次的非参数检验_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《基于秩次的非参数检验》由会员分享,可在线阅读,更多相关《基于秩次的非参数检验(11页珍藏版)》请在金锄头文库上搜索。

1、第七章第七章 基于秩次的非参数检验基于秩次的非参数检验 前言:前言: 1. 问题的提出:问题的提出: 前面学习了连续型资料两组样本均数差异的假设检验方法:前面学习了连续型资料两组样本均数差异的假设检验方法: 小样本用小样本用 t 检验,检验,条件条件是变量服从正态分布和方差齐。是变量服从正态分布和方差齐。 大样本用大样本用 Z 检验(检验(中心极限定理中心极限定理)。)。如果是小样本,变量的分布不清、已知不服从正态分布或经数学转换后仍不如果是小样本,变量的分布不清、已知不服从正态分布或经数学转换后仍不 服从正态分布时,如何检验两个样本或多个样本均数差异的统计学意义呢?服从正态分布时,如何检验两

2、个样本或多个样本均数差异的统计学意义呢?需要需要一种不依赖于分布假定一种不依赖于分布假定的检验方法,即的检验方法,即非参数检验非参数检验。2. 基本概念:基本概念:前面介绍的检验方法首先假定变量服从特定的已知分布(如正态分布),前面介绍的检验方法首先假定变量服从特定的已知分布(如正态分布), 然后对分布的参数(如均数)作检验。这类检验方法称为然后对分布的参数(如均数)作检验。这类检验方法称为参数检验参数检验。今天介绍的检验方法不对变量的分布作严格假定,检验不针对特定的参今天介绍的检验方法不对变量的分布作严格假定,检验不针对特定的参 数,而是模糊地数,而是模糊地对变量分布的中心位置或分布形态作检

3、验对变量分布的中心位置或分布形态作检验。这类检验称。这类检验称非参非参 数检验数检验,由于其对总体分布不作严格假定,所以又称任意分布检验。,由于其对总体分布不作严格假定,所以又称任意分布检验。(1)非参数检验的优点非参数检验的优点:a. 不受总体分布的限制,不受总体分布的限制,适用范围广适用范围广。 b. 适宜定量模糊的变量和等级变量适宜定量模糊的变量和等级变量。 c. 方法简便易学方法简便易学。(2)缺点缺点:对于适合用参数检验的资料,如用非参数检验会造成信息的丢失,:对于适合用参数检验的资料,如用非参数检验会造成信息的丢失, 犯第犯第类错误的概率增大,造成类错误的概率增大,造成检验功效下降

4、检验功效下降。(3)基于秩次的非参数检验基于秩次的非参数检验(秩和检验秩和检验)的的基本思想基本思想: 例:假设有一组观察值为例:假设有一组观察值为 1.1, 1.3, 1.7, 4.3, 11.4 。 显然这一变量不服从正态分布,观察值间差异较大,既不对称,标准差显然这一变量不服从正态分布,观察值间差异较大,既不对称,标准差 也较大。也较大。 如果将变量作转换,变成秩变量如果将变量作转换,变成秩变量 Y=1,2,3,4,5,则分布对称了,观,则分布对称了,观 察值间的差异也均匀了,标准差也减小了。察值间的差异也均匀了,标准差也减小了。 对秩和分布的中心位置对秩和分布的中心位置(平均秩和平均秩

5、和)作检验,这就是作检验,这就是秩和检验秩和检验。一一配对配对样本的符号样本的符号秩秩检验(检验(Wilcoxon signed rank test):):例例 7.1:研究出生先后的孪生兄弟智力是否存在差异?:研究出生先后的孪生兄弟智力是否存在差异?表表 7.3 12 对孪生兄弟智力测试结果对孪生兄弟智力测试结果 对子号对子号兄的得分兄的得分弟的得分弟的得分兄弟得分差兄弟得分差秩次秩次 1868823 2717767 37776-1-1.5 46864-4-4 5919655.5 672720- 77765-12-10 89190-1-1.5 97065-5-5.5 10718099 118

6、881-7-8 128772-15-11差值一般在差值一般在 5 左右,但个别较大,如左右,但个别较大,如 15,可能,可能不服从正态分布不服从正态分布。而且。而且 样本较小样本较小,不能利用中心极限定理作正态假定。因此考虑使用非参数检验,不能利用中心极限定理作正态假定。因此考虑使用非参数检验- 符号秩检验。符号秩检验。1符号秩检验的分布理论:假定有四对观察值,如果符号秩检验的分布理论:假定有四对观察值,如果 H0成立时,这四个值成立时,这四个值 有同等的概率取正值或负值,即每个值取正值的概率等于二分之一。四个值有同等的概率取正值或负值,即每个值取正值的概率等于二分之一。四个值 共有共有 24

7、=16 种组合,每种组合发生的可能性就是:种组合,每种组合发生的可能性就是: 。再考虑秩和,可能的结果数减少到。再考虑秩和,可能的结果数减少到 11 种,概率种,概率06250161 21 21 21 21.p 分布见表分布见表 7.1。表表 7.1 n4 时所有可能秩和情况和时所有可能秩和情况和 T*的分布的分布 正差数正差数 的秩次的秩次负差值负差值 的秩次的秩次正秩和正秩和 T+负秩和负秩和 T-概率概率 P 1,2,3,4-1000.0625 2,3,41910.0625 1,3,42820.0625 1,2,43730.1250 3,41,273 1,2,34640.1250 2,4

8、1,364 1,42,3550.1250 2,31,455 1,32,4460.1250 41,2,346 1,23,4370.1250 31,2,437 21,3,4280.0625 12,3,4190.0625-1,2,3,40100.0625 如果零假设成立,观察的结果应该服从此分布,即出现极端的可能性很如果零假设成立,观察的结果应该服从此分布,即出现极端的可能性很 小。如果真是出现小概率,那么我们对零假设的真实性产生怀疑,拒绝零假小。如果真是出现小概率,那么我们对零假设的真实性产生怀疑,拒绝零假 设。设。 2具体计算步骤具体计算步骤: (1)检验假设:)检验假设: H0:差值的总体中位

9、数为零差值的总体中位数为零。Md=0 H1:差值的总体中位数不等于零。:差值的总体中位数不等于零。Md0 =0.05。 (2)编秩和计算秩和:)编秩和计算秩和: 求差值求差值,差值的绝对值由小到大编秩差值的绝对值由小到大编秩,差数为零差数为零 不参加编秩,相同差值求平均秩不参加编秩,相同差值求平均秩。分别求正号和负号的秩和分别求正号和负号的秩和,取绝对值小的取绝对值小的 为为 T。(3)确定概率,下结论:查附表)确定概率,下结论:查附表 10,在,在 n=11 时,时,T0.05=11。现。现 T=24.511,故,故 P0.05,按,按 =0.05 的水准,不拒绝的水准,不拒绝 H0。 (T

10、 小,小,P 小)小)。3正态近似:当研究例数较大时正态近似:当研究例数较大时(n50),秩和,秩和 T 的分布近似正态分布,可的分布近似正态分布,可以用正态分布理论作假设检验:以用正态分布理论作假设检验: 这时正态分布的均数和标准差分别等于:这时正态分布的均数和标准差分别等于:24/ )12)(1(4/ )1( nnnnnTT 检验的公式为:检验的公式为:24/ )12)(1(5 . 0|4/ )1(|5 . 0| nnnnnTTZTT 二二两两独立独立样本的样本的秩和秩和检验检验(Wilcoxon rank sum test):表表 7.5 缺氧条件下猫与兔的生存时间缺氧条件下猫与兔的生存

11、时间(分分)比较比较 猫猫兔兔 生存时间生存时间秩次秩次生存时间生存时间秩次秩次生存时间生存时间秩次秩次生存时间生存时间秩次秩次 259.51512162812 34151522172813 44171632383014 4618174259.53516 46191952711 n1=5T1=78.5n2=14 T2=111.5这是生存时间资料,一般这是生存时间资料,一般不服从正态分布不服从正态分布,个别寿命长的为特大值,个别寿命长的为特大值,样样 本也较小本也较小,需考虑用非参数检验,需考虑用非参数检验-秩和检验。秩和检验。1具体计算步骤:具体计算步骤: (1) 检验假设:检验假设:H0:两

12、总体生存时间的中位数相等;:两总体生存时间的中位数相等; H1:两总体生存时间的中位数不等;:两总体生存时间的中位数不等; =0.05。(2) 编秩和计算秩和:两组由小到大编秩和计算秩和:两组由小到大混合编秩混合编秩,有,有相同值求平均秩相同值求平均秩(同组同组 相同值可不求平均秩相同值可不求平均秩),求例数较少组的秩和求例数较少组的秩和(T)。 ( 数值为零应编秩。数值为零应编秩。)(3) 确定概率,下结论:确定概率,下结论:T 值在表中两数值之间时,值在表中两数值之间时,p 值大于相应界值,值大于相应界值, T 位于区间之外,位于区间之外,P相应界值。相应界值。 本例本例 T= T1=78

13、.5,查附表,查附表 11,T =78.578,P0.01,拒绝,拒绝 H0,可认,可认 为猫、兔在缺氧的条件下生存时间不等。为猫、兔在缺氧的条件下生存时间不等。2正态近似:当样本较大时,秩和的分布近似正态分布,可以用正态正态近似:当样本较大时,秩和的分布近似正态分布,可以用正态分布理论作假设检验。这时正态分布的均数和标准差分别等于:分布理论作假设检验。这时正态分布的均数和标准差分别等于: nnttnnnnnkk TT33 2121 )(112)1(2/ )1( 检验公式为:检验公式为:215 . 0|2/ )1(|TnnTZ 三三多多个个样本样本分布位置相同的假设检验:分布位置相同的假设检验

14、: 完全随机化设计资料分布位置的假设检验(完全随机化设计资料分布位置的假设检验(Kruskal-Wallis test) 表表 7.7不同吸烟习惯母亲的新生儿体重(秩次)(不同吸烟习惯母亲的新生儿体重(秩次)(kg) ABCD 2.7(3)2.9(4)3.3(7)3.5(11) 2.4(2)3.2(5)3.6(12.5)3.6(12.5) 2.2(1)3.2(6)3.4(9)3.7(14) 3.4(9)3.4(9) 4(n)343 15(R)1537.537.5计算步骤:计算步骤: 1. 检验假设:检验假设:H0:k 个总体中心位置相等个总体中心位置相等 H1:k 个总体中心位置个总体中心位置

15、不全相等不全相等 =0.05 2. 计算统计量:各组由小到大计算统计量:各组由小到大混合编秩混合编秩;如;如不同组间出现相同值,求平均不同组间出现相同值,求平均 秩秩;计算各组的秩和计算各组的秩和。375. 9)114(3)35 .37 45 .37 315 415()114(1412)1(3)()1(12222212 nnR nnHkiii当当 H0成立时,该检验统计量近似服从自由度为成立时,该检验统计量近似服从自由度为(k-1)的的 2分布分布。校正公式:校正公式:50. 91414)22()33()22(1375. 9)( 13333313 nnttHHmpppCtp为相同值的个数。为相同值的个数。 3. 确定概率和判断结果:自由度确定概率和判断结果:自由度=k-1=4-1=3,查,查 2值表得值表得 2 0.05(3) =7.815,p0.05,故拒绝零假设,说明不同吸烟习惯对新生儿体重不同。,故拒绝零假设,说明不同吸烟习惯对新生儿体重不同。秩和检验的重点秩和检验的

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 研究报告 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号