秩转换的非参数检验.ppt

上传人:博****1 文档编号:570032876 上传时间:2024-08-01 格式:PPT 页数:82 大小:1.32MB
返回 下载 相关 举报
秩转换的非参数检验.ppt_第1页
第1页 / 共82页
秩转换的非参数检验.ppt_第2页
第2页 / 共82页
秩转换的非参数检验.ppt_第3页
第3页 / 共82页
秩转换的非参数检验.ppt_第4页
第4页 / 共82页
秩转换的非参数检验.ppt_第5页
第5页 / 共82页
点击查看更多>>
资源描述

《秩转换的非参数检验.ppt》由会员分享,可在线阅读,更多相关《秩转换的非参数检验.ppt(82页珍藏版)》请在金锄头文库上搜索。

1、第八章第八章秩转换的非参数检验秩转换的非参数检验 (Nonparametric Test)主要内容第一节 配对样本资料的Wilcoxon符号秩检验第二节 两个独立样本比较的Wilcoxon秩和检验第三节 完全随机设计多个样本比较的Kruskal- Wallis H检验第四节 随机区组设计多个样本的Friedman M检验参数检验参数检验n参数检验方法:参数检验方法:t 检验,方差分析;检验,方差分析;n总体分布假定:各组样本所来自的总体为总体分布假定:各组样本所来自的总体为正态分布(已知的分布形式)正态分布(已知的分布形式),各组样本所各组样本所来自的总体方差齐性。来自的总体方差齐性。非参数检

2、验非参数检验n定义:不依赖于总体的分布类型,对样本定义:不依赖于总体的分布类型,对样本所来自总体的分布不作严格假定的统计推所来自总体的分布不作严格假定的统计推断方法,称为非参数检验断方法,称为非参数检验(nonparametric test)。直接对总体分)。直接对总体分布做假设检验。布做假设检验。 又称为任意分布检验(又称为任意分布检验(distribution-free test)。)。要求:要求:要求:要求:样本来自给定分样本来自给定分样本来自给定分样本来自给定分布的总体,该总体分布布的总体,该总体分布布的总体,该总体分布布的总体,该总体分布依赖于若干参数:依赖于若干参数:依赖于若干参数

3、:依赖于若干参数:统计分析:统计分析:统计分析:统计分析:参数估计参数估计参数估计参数估计假设检假设检假设检假设检验:参数验:参数验:参数验:参数 参数检验参数检验 parametric testparametric test 非参数检验非参数检验Non-parametric testNon-parametric test要求:要求:要求:要求:对对对对总体的分布总体的分布总体的分布总体的分布类型不作任何要求类型不作任何要求类型不作任何要求类型不作任何要求 统计分析:统计分析:统计分析:统计分析:假设检验:假设检验:假设检验:假设检验: 总体的分布位置总体的分布位置总体的分布位置总体的分布位置

4、 注意:注意:如果已知其计量资料满足(或近如果已知其计量资料满足(或近似满足)似满足) 检验或检验或 检验条件,当然检验条件,当然选选 检验或检验或 检验,因为这时若选秩检验,因为这时若选秩转换的非参数检验,会降低检验效能。转换的非参数检验,会降低检验效能。 非参数检验是一类统计学方法的总称,非参数检验是一类统计学方法的总称,基于秩转换(基于秩转换(rank transformation)的)的非参数检验只是其中的一种。非参数检验只是其中的一种。秩转换的非参数检验秩转换的非参数检验n秩次(秩次(rank):某种测量值按照从小到大):某种测量值按照从小到大的顺序排序后,每一测量值所对应的序号。的

5、顺序排序后,每一测量值所对应的序号。n秩转换:将某一变量值从小到大排序后,秩转换:将某一变量值从小到大排序后,获得每一变量值的秩次,并用此秩次代替获得每一变量值的秩次,并用此秩次代替原有变量值的过程。原有变量值的过程。秩转换的非参数检验秩转换的非参数检验 秩和检验的方法秩和检验的方法-秩转换秩转换秩和检验的基本计算步骤:1.将数据(x)按大小转化为秩次(i),用秩次的大小反映变量值的大小。2.对各组”秩次”求和,称为秩和(T =i)。3.对各组秩和(T)做检验的方法称为秩和检验。 例例: 秩转换的基本方法秩转换的基本方法 将两组比较原始数据(X)混合按大小编秩,如x相同取平均秩, 分别对各组的

6、秩求和(T).甲组(x) 3 5 10 20 22 秩和秩号 (i) 1 3 5 7 8 T1=24乙组(x) 4 9 15 25 35秩号(i) 2 4 6 9 10 T2=31 总秩和总秩和T=10(10+1)/2=55例例: 两组比较的等级数据编秩两组比较的等级数据编秩 A组 : 、 +、 +、 +、 + 秩(i) : 1 2 4.5 4.5 4.5 8.5秩和 : TA25 (组间相同,求平均秩) B组 : +、+、+、+、+、+ 秩(i) :4.5 8.5 8.5 8.5 11 12 秩和 : TB53 (组内相同,不影响求秩和)总秩和总秩和 : TA+TB=12(12+1)/2=7

7、8秩次:在一定程度上反映了原始数据大小(等级)的信息。秩和:反映了一组数据在分布上的范围位置。平均秩次:反映一组数据平均水平 A组平均秩次=23.5/6=3.92 B组平均秩次=54.5/6=9.08A组组(x) 3, 5, 7, 9 11 14 (i) 1 2 3 4 5 8.5 T=23.5B组组(x) 12 13 14 16 20 22 (i) 6 7 8.5 10 11 12 T=54.5非参数检验的应用场合非参数检验的应用场合n计量资料计量资料:不满足参数检验的条件,且无适当的变量变不满足参数检验的条件,且无适当的变量变换方法解决此问题时;换方法解决此问题时;分布类型无法获知的小样本

8、计量资料;分布类型无法获知的小样本计量资料;一端或两端存在不确定数值(如一端或两端存在不确定数值(如1000IU)的计量资料;的计量资料;n等级资料等级资料:比较各组间等级强度的差别。比较各组间等级强度的差别。非参数检验的优缺点:优点: 适用范围广 对数据要求不严 方法简便、易于理解和掌握缺点: 损失信息、检验效能低符合条件符合条件首选参数检验首选参数检验不符合条件不符合条件非参数检验非参数检验第一节第一节 配对样本比较的配对样本比较的Wilcoxon符号秩检验符号秩检验Wilcoxon符号秩检验简介符号秩检验简介符号秩检验由符号秩检验由Wilcoxon于于1945年提出;年提出;应用:应用:

9、n配对样本差值的中位数与配对样本差值的中位数与0比较;比较;n单个样本中位数与总体中位数(给定值)单个样本中位数与总体中位数(给定值)的比较。的比较。符号秩检验的基本思想符号秩检验的基本思想n在在H0成立(两配对样本差值的总体中位数成立(两配对样本差值的总体中位数为为0)的条件下,两配对样本的差值的正负)的条件下,两配对样本的差值的正负及其绝对值的相对大小是随机的;及其绝对值的相对大小是随机的;n在此情况下,正秩和与负秩和之间应当相在此情况下,正秩和与负秩和之间应当相近,差别不会太大;近,差别不会太大;n如果正秩和与负秩和之间相差足够大,则如果正秩和与负秩和之间相差足够大,则可认为可认为H0成

10、立的可能性很小,从而加以拒成立的可能性很小,从而加以拒绝。绝。1.1.配对样本差值的中位数与配对样本差值的中位数与0 0比较比较 配对设计两组处理效应的比较一配对设计两组处理效应的比较一般采用配对般采用配对t t 检验,如果差数严重检验,如果差数严重偏离正态分布,可采用偏离正态分布,可采用Wilcoxon符符号秩检验。号秩检验。例例8-1:两种方法测量:两种方法测量12份血清份血清ALT测量结果测量结果编号号(1)原法原法(2)新法新法(3)差差值d(4)=(3)-(2)16076162142152103195243484808225242240-26220220071902051582538

11、13919824345103844611236190-4612951005合合计例例8-1:两种方法测量:两种方法测量12份血清份血清ALT测量结果测量结果编号号(1)原法原法(2)新法新法(3)差差值d(4)=(3)-(2)正秩正秩(5)负秩秩(6)160761682142152105319524348114808221.55242240-21.56220220071902051578253813691982434591038446411236190-4610129510053合合计54.511.5 例例8-1分析结果分析结果取负秩和为取负秩和为T,则,则T=11.5;查查T界值表得界值表得

12、0.05P25时,T分布近似正态分布可用正态近似法作u检验:相同秩次较多时的校正值:注意注意:仍为非参数检验2.2.配对设计等级资料的符号秩检验配对设计等级资料的符号秩检验1. 把等级从弱到强转换成秩,如某指标的检测结果把等级从弱到强转换成秩,如某指标的检测结果为为-,+,+,+,可转化为相应的秩次,可转化为相应的秩次1,2,3,4;2. 求各对秩次的差值,省略所有差值为求各对秩次的差值,省略所有差值为0的对子数,的对子数,令余下的有效对子数为令余下的有效对子数为n;3. 按按n个差值编正秩与负秩,求正秩和与负秩和个差值编正秩与负秩,求正秩和与负秩和 注意:由于等级资料相同秩多,此时小样本的检

13、注意:由于等级资料相同秩多,此时小样本的检验结果会存在偏性,最好用大样本。验结果会存在偏性,最好用大样本。3. 单个样本中位数和指定的单个样本中位数和指定的总体中位数比较总体中位数比较例例8-2:12名工人尿氟含量与名工人尿氟含量与45.3比较比较尿氟含量尿氟含量(1)(1)- 45.3(2)正秩正秩(3)负秩秩(4)44.21-1.091.545.30046.391.091.549.474.17351.055.75453.167.86553.267.96654.379.07757.1611.86867.3722.07971.0525.751087.3742.0711合合计64.51.5假设检

14、验过程假设检验过程u与配对资料符号秩检验基本相同。与配对资料符号秩检验基本相同。u此处先计算每一测量值与给定的值的差数;此处先计算每一测量值与给定的值的差数;u然后对此差数进行秩转换,进行与配对资料符号然后对此差数进行秩转换,进行与配对资料符号秩检验完全相同的操作过程。秩检验完全相同的操作过程。u此例得此例得T=1.5,查表得,查表得P0.005;u拒绝拒绝H0,认为该厂工人的尿氟含量高于当地正,认为该厂工人的尿氟含量高于当地正常人的水平。常人的水平。第二节第二节 两个独立样本比较的两个独立样本比较的 Wilcoxon秩和检验秩和检验Wilcoxon秩和检验秩和检验nWilcoxon秩和检验(

15、秩和检验(rank sum test)用于)用于推断计量资料或等级资料的两个独立样本推断计量资料或等级资料的两个独立样本所来自总体的分布位置是否有差别。所来自总体的分布位置是否有差别。n对分布的形状不加考虑,因此应注意分布对分布的形状不加考虑,因此应注意分布位置和分布(包括位置和形状)的区别。位置和分布(包括位置和形状)的区别。n分布形状相同或类似的两个总体分布位置分布形状相同或类似的两个总体分布位置比较,可以简化地理解为两总体中位数的比较,可以简化地理解为两总体中位数的比较。比较。1. 1. 计量资料两样本比较计量资料两样本比较例例8-3 两类肺病患者两类肺病患者RD值比较值比较肺癌病人肺癌

16、病人矽矽肺肺0期工人期工人RD值秩次秩次RD值秩次秩次2.7813.232.53.232.53.5044.2074.0454.87144.1565.12174.2886.21184.3497.18194.47108.05204.64118.56214.75129.60224.82134.95155.1016n1=10T1=141.5n2=12T2=111.5(1)建立检验假设,确定检验水准)建立检验假设,确定检验水准H0:两组患者:两组患者RD值总体分布位置相同值总体分布位置相同H1:肺癌病人:肺癌病人RD值高于矽肺值高于矽肺0期工人期工人RD值值=0.05(2)混合编秩,求统计量)混合编秩,

17、求统计量Tu将两样本数据混合,从小到大排序;将两样本数据混合,从小到大排序;u对混合数据进行秩转换,获得每一观察值对应对混合数据进行秩转换,获得每一观察值对应的秩次;的秩次;u观察值相等者取平均秩次;观察值相等者取平均秩次;u分别计算两样本的秩和;分别计算两样本的秩和;u取样本量较小者为取样本量较小者为n1,其秩和作为统计量,其秩和作为统计量T;u两样本量相等者任取其中一个作为统计量两样本量相等者任取其中一个作为统计量T(通(通常取秩和较小者)。常取秩和较小者)。 若若H0成立,成立,T值应接近值应接近 ,若,若T值严重偏离值严重偏离 ,则提示,则提示H0可能是不正确的。小样本时,可能是不正确

18、的。小样本时,查查T界值表。界值表。较小例数组的平均秩和为:较小例数组的平均秩和为:(3)确定)确定P值,作出结论值,作出结论若若n110且且n2-n110,可通过查阅,可通过查阅T界值表界值表(附表(附表10)确定)确定P值;值;若两样本量不满足上述条件,则可采用正若两样本量不满足上述条件,则可采用正态近似法作态近似法作u检验,按公式(检验,按公式(8-2)计算)计算u值。值。正态近似法正态近似法例例8-3分析结果分析结果本例本例n1=10, n2-n1=2,T=T1=141.5,满足查,满足查T界值表的条件;界值表的条件;查表得查表得单侧单侧0.025P0.05;拒绝拒绝H0 ,认为肺癌病

19、人的,认为肺癌病人的RD值高于矽肺值高于矽肺0期病人的期病人的RD值。值。2. 等级资料两样本比较等级资料两样本比较例例8-4 吸烟和不吸烟工人吸烟和不吸烟工人HbCO含量比较含量比较含量含量吸烟吸烟不吸烟不吸烟合合计秩范秩范围平均秩平均秩秩和秩和(1)(2)(3)(4)(5)(6)吸烟吸烟(7)=(2)(6)不吸烟不吸烟(8)= (3)(6)很低很低12313224低低8233143419152437中中161127356148768528偏高偏高10414627568.5685274高高404767977.53100合合计39(n1) 40(n2)791917(T1)1243(T2)(1)

20、建立检验假设,确定检验水准)建立检验假设,确定检验水准H0:两组工人:两组工人HbCO含量总体分布位置相同含量总体分布位置相同H1:吸烟工人:吸烟工人HbCO含量高于不吸烟工人含量高于不吸烟工人=0.05(2)混合编秩,求统计量)混合编秩,求统计量Tu确定各等级的合计人数;确定各等级的合计人数;u根据各等级的合计人数确定其秩次范围和平均根据各等级的合计人数确定其秩次范围和平均秩;秩;u分别计算两样本的秩和;分别计算两样本的秩和;u取样本量较小者为取样本量较小者为n1,其秩和(,其秩和(T1)作为统计)作为统计量量T;u根据公式(根据公式(8-2)计算)计算u值,执行值,执行u检验过程。检验过程

21、。例例8-4分析结果分析结果本例本例n1=39, n2=40,T=T1=1917;计算得计算得u=3.7023,查表得单侧,查表得单侧P5或或g3时,则,则H或或Hc近似服从近似服从=g-1的的卡方分布,可通过卡方分布,可通过查阅卡方界值表确定查阅卡方界值表确定P值值。例例8-5分析结果分析结果本例本例n1=n2=n3=5,N=15,满足查,满足查H界值表的条件;界值表的条件;计算得计算得H=9.74,查表得双侧,查表得双侧P3,通过查卡方界值表(附表,通过查卡方界值表(附表8)确)确定定P值;值;例例8-7分析结果分析结果本例计算得本例计算得H=14.28,Hc =15.52,查卡方界,查卡

22、方界值表得双侧值表得双侧P0.005;拒绝拒绝H0 ,认为四种疾病患者痰液内噬酸粒,认为四种疾病患者痰液内噬酸粒细胞有差别。细胞有差别。秩和检验的两两比较方法有:1、Nemenyi法检验2、扩展的t检验3、q检验几种方法理论上仍存在争议,故几种方法理论上仍存在争议,故SASSAS、SPSSSPSS等软件没有提供这方面的分析等软件没有提供这方面的分析3. 多个独立样本两两比较的多个独立样本两两比较的Nemenyi检验检验Nemenyi检验方法简介检验方法简介n类似于多组样本比较方差分析的情形,当类似于多组样本比较方差分析的情形,当经过多个独立样本比较的经过多个独立样本比较的Kruskal-Wal

23、lis H检验拒绝检验拒绝H0之后,可进一步进行组间两两之后,可进一步进行组间两两比较;比较;nNemenyi检验即为执行此类统计学比较的方检验即为执行此类统计学比较的方法之一。法之一。例例8-8 小白鼠接种三种伤寒菌的存活日数小白鼠接种三种伤寒菌的存活日数9D11CDSC1存活日数存活日数秩次秩次存活日数存活日数秩次秩次存活日数存活日数秩次秩次22510.534.522510.5510.522615.5615.534.5615.5615.5Ri84169212ni10911Ri8.4018.7819.27三组样本所来自的总体分布位置比较三组样本所来自的总体分布位置比较n三组样本所来自的总体分

24、布位置比较的操作过程三组样本所来自的总体分布位置比较的操作过程与例与例8-5完全相同;完全相同;n本例得本例得Hc=9.97,P0.01,拒绝,拒绝H0;n认为接种三种伤寒杆菌的存活日数有差别;认为接种三种伤寒杆菌的存活日数有差别;n为进一步观察不同伤寒杆菌之间的差别,可进一为进一步观察不同伤寒杆菌之间的差别,可进一步进行三组间的两两比较。步进行三组间的两两比较。任意两组间分布位置的比较任意两组间分布位置的比较n计算各组的平均秩和,根据公式(计算各组的平均秩和,根据公式(8-6)计)计算任意两组之间比较的卡方值;算任意两组之间比较的卡方值;n自由度取组数减一,即自由度取组数减一,即=g-1;n

25、查表确定相应的查表确定相应的P值,进行统计推断。值,进行统计推断。例例8-8分析结果分析结果n ,0.025P0.05n ,0.01P0.025n ,0.99P15或处理组数或处理组数g15时,则通过公式时,则通过公式(8-8)进行近似卡方检验,确定)进行近似卡方检验,确定P值。值。实际上当实际上当g4,或者,或者g=4且且n5,或者,或者g=3且且n9 ,即可采用近似卡方检验方法。即可采用近似卡方检验方法。例例8-98-9分析结果分析结果本例计算得本例计算得M=199.5,查,查M界值表得双侧界值表得双侧P0.05;拒绝拒绝H0 ,认为四种频率声音刺激的反应率,认为四种频率声音刺激的反应率有

26、差别。有差别。2. 多个相关样本两两比较的多个相关样本两两比较的q检验检验q检验方法简介检验方法简介n当经过多个相关样本比较的当经过多个相关样本比较的Friedman M检验拒绝检验拒绝H0之后,可进一步执行组间两之后,可进一步执行组间两两比较的操作;两比较的操作;nq检验可用以执行多个相关样本的两两比检验可用以执行多个相关样本的两两比较过程。较过程。q检验方法操作过程检验方法操作过程n操作过程类似于方差分析组间两两比较的操作过程类似于方差分析组间两两比较的SNK-q检验;检验;n任意两组间比较的任意两组间比较的q值通过公式(值通过公式(8-9)和公式)和公式(8-10)计算;)计算;n自由度

27、自由度=(n-1)(g-1),样本跨度,样本跨度a是指是指g个样本秩和个样本秩和从小到大排序后所比较的两个秩和间所涵盖的秩从小到大排序后所比较的两个秩和间所涵盖的秩和个数(包括二者本身);和个数(包括二者本身);n根据计算结果查阅根据计算结果查阅q界值表(附表界值表(附表4),获得),获得P值值例例8-9数据的两两比较结果数据的两两比较结果qaP频率率A与与频率率D比比较7.872140.01频率率A与与频率率C比比较5.322130.05频率率B与与频率率D比比较5.752130.05秩转换非参数检验小结秩转换非参数检验小结1. 参数检验与非参数检验的对比参数检验与非参数检验的对比参数检验参

28、数检验秩转换的非参数检验秩转换的非参数检验针对原始数据进行分析针对原始数据进行分析针对原始数据对应的秩次进行针对原始数据对应的秩次进行分析分析对总体参数进行估计对总体参数进行估计不估计总体参数不估计总体参数对总体参数进行假设检验对总体参数进行假设检验对总体分布位置进行假设检验对总体分布位置进行假设检验资料满足参数检验条件时,参资料满足参数检验条件时,参数检验效能较高数检验效能较高资料满足参数检验条件时,使资料满足参数检验条件时,使用非参数检验会导致检验用非参数检验会导致检验效能下降效能下降2. 参数检验和非参数检验的对应关系参数检验和非参数检验的对应关系比比较类型型参数参数检验非参数非参数检验单组样本与给定值比较单组样本与给定值比较单组样本单组样本t检验检验Wilcoxon符号秩检验符号秩检验配对样本比较配对样本比较配对配对t检验检验Wilcoxon符号秩检验符号秩检验两组独立样本比较两组独立样本比较成组成组t检验检验Wilcoxon秩和检验秩和检验多组独立样本比较多组独立样本比较单因素方差分析单因素方差分析Kruskal-Wallis秩和检验秩和检验随机区组设计多样本比较随机区组设计多样本比较两因素方差分析两因素方差分析Friedman M检验检验多组独立样本两两比较多组独立样本两两比较SNK-q检验等检验等Nemenyi检验检验

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号