医学统计学精品教学(汕头大学)第十章-非参数检验

上传人:re****.1 文档编号:580246786 上传时间:2024-08-28 格式:PPT 页数:76 大小:1.19MB
返回 下载 相关 举报
医学统计学精品教学(汕头大学)第十章-非参数检验_第1页
第1页 / 共76页
医学统计学精品教学(汕头大学)第十章-非参数检验_第2页
第2页 / 共76页
医学统计学精品教学(汕头大学)第十章-非参数检验_第3页
第3页 / 共76页
医学统计学精品教学(汕头大学)第十章-非参数检验_第4页
第4页 / 共76页
医学统计学精品教学(汕头大学)第十章-非参数检验_第5页
第5页 / 共76页
点击查看更多>>
资源描述

《医学统计学精品教学(汕头大学)第十章-非参数检验》由会员分享,可在线阅读,更多相关《医学统计学精品教学(汕头大学)第十章-非参数检验(76页珍藏版)》请在金锄头文库上搜索。

1、第十章第十章 非参数秩和检验非参数秩和检验吴吴 库库 生生汕头大学医学院预防医学教研室8/28/20241参数统计与非参数统计1、参数统计(参数统计(parametric statistics) 样本所来自的总体分布具有某个已知样本所来自的总体分布具有某个已知的函数形式(如正态分布),而其中的函数形式(如正态分布),而其中有有的的参数参数是未知的,统计分析的目的是对是未知的,统计分析的目的是对这些未知的参数进行估计或检验。这些未知的参数进行估计或检验。8/28/20242秩和检验但实际上有些医学研究资料并但实际上有些医学研究资料并不符合上述不符合上述条件条件,即使用变量变换的方法也难以达,即使

2、用变量变换的方法也难以达到应用参数方法的要求。到应用参数方法的要求。这就需要一种这就需要一种不依赖于总体分布不依赖于总体分布的具体形的具体形式的统计方法来解决此类问题。式的统计方法来解决此类问题。由于这类方法不受总体参数的影响,故称由于这类方法不受总体参数的影响,故称非参数检验法。非参数检验法。它检验的是它检验的是分布分布,而非,而非参数。参数。8/28/20243秩和检验2、非参数统计(、非参数统计( non-parametric statistics ) 不考虑研究对象总体分布的具体形式,也不考虑研究对象总体分布的具体形式,也不对总体参数进行统计推断,而是通过检验不对总体参数进行统计推断,

3、而是通过检验样本所代表的样本所代表的总体分布形式是否一致总体分布形式是否一致来得出来得出统计结论。由于这类方法不受总体参数的限统计结论。由于这类方法不受总体参数的限制,故称非参数统计法。有时也称为任意分制,故称非参数统计法。有时也称为任意分布检验布检验(distribution-free statistics)(distribution-free statistics)。8/28/20244秩和检验3、非参数统计的优点非参数统计的优点 适用范围广,不论样本所代表的总体分适用范围广,不论样本所代表的总体分布形式如何,甚至是未知的,都可适用;布形式如何,甚至是未知的,都可适用; 资料可用资料可用“

4、等级等级”、“符号符号”表示,收表示,收集方便;集方便; 多数非参数检验多数非参数检验方法简便,易于理解和方法简便,易于理解和掌握。掌握。8/28/20245秩和检验4、非参数统计的缺点非参数统计的缺点 对符合用参数检验的资料,如用非参数对符合用参数检验的资料,如用非参数统计,会丢失信息,导致检验效率下降,统计,会丢失信息,导致检验效率下降,犯第犯第IIII类错误的可能性比参数检验大类错误的可能性比参数检验大, ,即即 值值; 非参数检验的有些问题的计算仍显繁冗。非参数检验的有些问题的计算仍显繁冗。8/28/20246秩和检验何时使用非参数检验何时使用非参数检验?1.1.等级资料(半定量资料)

5、等级资料(半定量资料) 当指标只能用严重程度当指标只能用严重程度( (轻、中、重轻、中、重) ),优劣,优劣等级(好、中、差),治疗转归(治愈、好转、等级(好、中、差),治疗转归(治愈、好转、无效)等形式表达时,原始资料并非定量的,这无效)等形式表达时,原始资料并非定量的,这些数据比些数据比“定量定量”粗,而比一般的粗,而比一般的“定性定性”细,细,是相继的若干阶梯。但毗邻的阶梯之间并非等距是相继的若干阶梯。但毗邻的阶梯之间并非等距离,亦不能度量。离,亦不能度量。2.2.偏态分布资料偏态分布资料8/28/20247秩和检验何时使用非参数检验何时使用非参数检验?3.3.个别数据偏离过大资料个别数

6、据偏离过大资料 这里指的是随机的偏离而不属于这里指的是随机的偏离而不属于“过失误差过失误差”所致。还有一种情况就是数据的某一端无确定所致。还有一种情况就是数据的某一端无确定数值,如数值,如“50mg”等等,只给一等等,只给一个上限或下限,而没有具体数值。个上限或下限,而没有具体数值。4.4.各组离散程度相差悬殊各组离散程度相差悬殊( (方差不齐方差不齐) )的资料的资料 如经变量变换达到方差齐性,则可用参数检如经变量变换达到方差齐性,则可用参数检验;否则的话就要用非参数法处理。验;否则的话就要用非参数法处理。8/28/20248秩和检验何时使用非参数检验何时使用非参数检验?5.5.分布形态不明

7、的资料分布形态不明的资料 小样本,但又不趋向于正态分布;不小样本,但又不趋向于正态分布;不稳定,例数少,分布不明确的资料。稳定,例数少,分布不明确的资料。 符合参数检验条件首选参数检验 不符合条件非参数检验8/28/20249秩和检验秩和检验秩和检验秩次秩次(rankrank):就是将观察值按顺序由小):就是将观察值按顺序由小到大排列到大排列( (排名次排名次) ),并用序号(如,并用序号(如1, 2, 1, 2, 3 3 )代替变量值本身,秩次即通常意)代替变量值本身,秩次即通常意义上的序号。义上的序号。秩和:秩和:即秩次的和。即秩次的和。秩转换秩转换:将数值变量转换成秩次,再计算:将数值变

8、量转换成秩次,再计算检验统计量的过程。检验统计量的过程。秩和检验秩和检验:就是通过秩次的排列求秩和进:就是通过秩次的排列求秩和进行假设检验的方法。行假设检验的方法。8/28/202410秩和检验Contents第一节第一节 配对资料的符号秩和检验(配对资料的符号秩和检验(WilcoxonWilcoxon配对法)配对法)第二节第二节 两独立样本比较的秩和检验(两独立样本比较的秩和检验(WilcoxonWilcoxon两样本两样本法)法)第三节第三节 完全随机设计多个样本比较的秩和检验完全随机设计多个样本比较的秩和检验(KruskalKruskal- -allisallis检验)检验)8/28/2

9、02411秩和检验第一节第一节 两配对样本差值的符号秩和检验两配对样本差值的符号秩和检验(Wilcoxon signed rank test) 符号秩和检验由符号秩和检验由WilcoxonWilcoxon于于19451945年提年提出,作为配对出,作为配对t t检验的替代方法。检验配检验的替代方法。检验配对资料的差值是否来自对资料的差值是否来自中位数中位数为为0 0的总体。的总体。 在数据满足配对在数据满足配对t t检验的要求时,符检验的要求时,符号秩和检验的功效是配对号秩和检验的功效是配对t t检验效能的检验效能的95%95%左右。左右。8/28/202412秩和检验符号秩和检验的符号秩和检

10、验的基本思想基本思想:在在H H0 0成立的条件下(两配对处理效应相成立的条件下(两配对处理效应相同同 ),两配对样本的差数的正负是随机),两配对样本的差数的正负是随机的,则正差数的秩和与负差数的秩和应的,则正差数的秩和与负差数的秩和应该相差不会太大,该相差不会太大,即总体中位数为即总体中位数为0 0;反;反之,若两秩和相差太悬殊,则认为之,若两秩和相差太悬殊,则认为H H0 0成成立的可能性受到怀疑,从而拒绝立的可能性受到怀疑,从而拒绝H H0 0,接受接受H H1 1。8/28/202413秩和检验例例1 1:分别用氰化高铁法与光电比色法测:分别用氰化高铁法与光电比色法测得得1010个血样

11、的血红蛋白含量,问两法测个血样的血红蛋白含量,问两法测得结果有无差别?得结果有无差别?8/28/202414秩和检验表表1 1 两种方法测定血清血红蛋白含量两种方法测定血清血红蛋白含量血样号血样号 氰化高铁法氰化高铁法 光电比色法光电比色法 1 15.0 12.51 15.0 12.5 2 12.8 12.9 2 12.8 12.9 3 13.5 13.0 3 13.5 13.0 4 11.3 12.8 4 11.3 12.8 5 12.3 15.4 5 12.3 15.4 6 12.1 12.9 6 12.1 12.9 7 13.7 13.0 7 13.7 13.0 8 12.9 14.1

12、8 12.9 14.1 9 12.9 12.1 9 12.9 12.1 10 13.0 12.9 10 13.0 12.9 配对差值经检验不符合正态分布,不满足t检验条件8/28/20248/28/20241515医学统计学医学统计学- -秩和检验秩和检验符号秩和检验的基本步骤:1.1.建立检验假设,确定检验水准建立检验假设,确定检验水准 H H0 0 :MdMd=0=0(两处理效应相同)两处理效应相同) H H1 1 :MdMd0 0(两处理效应不相同)两处理效应不相同) =0.05=0.058/28/202416秩和检验2. 求两组数据的差数求两组数据的差数d d,对差数的绝对值对差数的绝

13、对值编秩号编秩号 差数为差数为0 0的数据忽略不计,对子数减的数据忽略不计,对子数减1 1; 余下的余下的n-in-i个差数个差数按绝对值按绝对值由小到大排由小到大排秩号,但排好后的秩号秩号,但排好后的秩号要保持原差数的正负要保持原差数的正负号号; 差数绝对值相等时,则取其平均秩次。差数绝对值相等时,则取其平均秩次。8/28/202417秩和检验表表1 1 两种方法测定血清血红蛋白含量两种方法测定血清血红蛋白含量血样号血样号 氰化高氰化高 光电比光电比 差值差值 负秩负秩 正秩正秩 铁法铁法 色法色法 (1) (2) (3) (4)=(2)-(3) (5) (6) (1) (2) (3) (4

14、)=(2)-(3) (5) (6) 1 15.0 12.5 2.5 9 1 15.0 12.5 2.5 9 2 12.8 12.9 - 2 12.8 12.9 -0.10.1 -1.5 -1.5 3 13.5 13.0 0.5 3 3 13.5 13.0 0.5 3 4 11.3 12.8 -1.5 -8 4 11.3 12.8 -1.5 -8 5 12.3 15.4 -3.1 -10 5 12.3 15.4 -3.1 -10 6 12.1 12.9 - 6 12.1 12.9 -0.80.8 -5.5 -5.5 7 13.7 13.0 0.7 4 7 13.7 13.0 0.7 4 8 12

15、.9 14.1 -1.2 -7 8 12.9 14.1 -1.2 -7 9 12.9 12.1 9 12.9 12.1 0.80.8 5.5 5.5 10 13.0 12.9 10 13.0 12.9 0.10.1 1.5 1.5 T T- -= -32 T= -32 T+ +=23=23验算验算: :| | | |T T+ + | | | |+ +| | | | T T- -| | =n(n+1)/2=55=n(n+1)/2=55统计量统计量统计量统计量T T对差对差数的数的绝对绝对值编值编秩秩8/28/20248/28/20241818医学统计学医学统计学- -秩和检验秩和检验3. 分别求

16、正、负差数的秩和,以绝对值较分别求正、负差数的秩和,以绝对值较小者为小者为T T 验算:验算:T T+ +T+T- -=n(n+1)/2=n(n+1)/24. 4. 确定确定P P值和作出推断结论值和作出推断结论小样本时(小样本时(n n50, 50, n n为为d d00的对子数的对子数), ,通过查通过查p226p226附表附表8(T8(T界值表界值表) )得到得到P P值,值,原则原则是:若统计量是:若统计量T T处于某处于某T T界值范围之界值范围之内,其内,其P P值大于或等于相应概率;反之,值大于或等于相应概率;反之,则小于相应概率。当则小于相应概率。当T T值恰好等于附表中值恰好

17、等于附表中的界值时,其确切概率常小于相应的概的界值时,其确切概率常小于相应的概率水平。率水平。8/28/202419秩和检验本例中:本例中:T=23 对子数对子数n=10,查,查p226附表附表8得得2310 45 10 45 故故 P0.10下结论:在下结论:在=0.05=0.05水准上不拒绝水准上不拒绝H H0 0 ,故,故不能认为两法测得血红蛋白含量有差别。不能认为两法测得血红蛋白含量有差别。8/28/202420秩和检验 大样本时(大样本时( 对子数对子数n50)通过公式进)通过公式进行行u u转化,采用正态近似检验:转化,采用正态近似检验: (式(式10-110-1) 式中式中0.5

18、0.5是连续性校正数是连续性校正数, ,因为因为T T值是值是不连续的不连续的, ,而而u u分布是连续的。分布是连续的。 秩和标准秩和标准差差平均秩和平均秩和8/28/202421秩和检验当存在同一秩较多时,按(式当存在同一秩较多时,按(式10-110-1)计算)计算的的u u值要比实际的值要比实际的u u值小,应采用(公式值小,应采用(公式10-210-2)对)对u u加以校正加以校正: :其中,其中,t tj j是是相同秩号的个数。相同秩号的个数。校正系数校正系数8/28/202422秩和检验符号秩和检验的SPSS实现 SPSS(Statistical Package for Socia

19、l Science,社会科学统计软件包)一直是国际上最流行且最具权威性的统计分析软件之一。SPSS最显著的特点是菜单和对话框操作方式,无需编程,且图形功能强大,易于掌握和操作。8/28/202423秩和检验8/28/202424秩和检验符号秩和检验的SPSS实现1 定义变量8/28/202425秩和检验符号秩和检验的SPSS实现2 输入数据8/28/202426秩和检验8/28/202427秩和检验符号秩和检验的SPSS实现8/28/202428秩和检验符号秩和检验的SPSS实现8/28/202429秩和检验Wilcoxon Signed Ranks Test结果8/28/202430秩和检验

20、第二节第二节 两独立样本秩和检验(两独立样本秩和检验(WilcoxonWilcoxon两样本比较法)两样本比较法) 观测值观测值X X A 7 14 22 36 40 48 63 98 41.00A 7 14 22 36 40 48 63 98 41.0029.8129.81B 3 5 6 10 17 18 20 39 14.75B 3 5 6 10 17 18 20 39 14.7511.7311.73方差齐性检验方差齐性检验方差齐性检验方差齐性检验: : P0.05 P0.05两样本方差不齐,不能应用两样本方差不齐,不能应用两样本方差不齐,不能应用两样本方差不齐,不能应用t t检验检验检验

21、检验8/28/20248/28/20243131医学统计学医学统计学- -秩和检验秩和检验采用采用Wilcoxon两独立样本秩和检验两独立样本秩和检验基本思想:基本思想:假定原假设假定原假设H H0 0成立(成立(样本来自两样本来自两个相同总体个相同总体),合并两样本,将观察值由),合并两样本,将观察值由小到大排列,编写秩次。在小到大排列,编写秩次。在H H0 0成立的条件下,成立的条件下,T T值应接近平均秩和值应接近平均秩和n n0 0(1+N)/2(1+N)/2,其中,其中N=nN=n1 1+n+n2 2, n, n0 0=min(n=min(n1 1, n, n2 2) )。如果如果T

22、 T值严重偏离平均秩和,则提示值严重偏离平均秩和,则提示H H0 0可能是可能是不正确的。不正确的。(1+2+3+ +16)/2=681+2+3+ +16)/2=681+2+3+ +16)/2=681+2+3+ +16)/2=68n n0 0(1+N)/2=8*(1+16)=68(1+N)/2=8*(1+16)=688/28/20248/28/20243232医学统计学医学统计学- -秩和检验秩和检验采用Wilcoxon秩和检验一、建立检验假设,确定检验水准一、建立检验假设,确定检验水准 H H0 0 :样本来自两个相同总体样本来自两个相同总体 (样本的每个观察值来自两总体的概率(样本的每个观

23、察值来自两总体的概率均为均为0.50.5) H H1 1 :样本来自两个不同总体样本来自两个不同总体 (样本的每个观察值来自两总体的概率(样本的每个观察值来自两总体的概率不等)不等) =0.058/28/20248/28/20243333医学统计学医学统计学- -秩和检验秩和检验二、编秩二、编秩 将两组数据由小到大统一编秩,如遇将两组数据由小到大统一编秩,如遇相同相同原始数据原始数据,若若在同一组在同一组,仍按数据,仍按数据出现顺序编秩;若出现顺序编秩;若在不同组在不同组,则取其平,则取其平均秩次。本例编秩结果见表均秩次。本例编秩结果见表2 28/28/202434秩和检验表2 两种疗法的退热

24、时间 新疗法新疗法 旧疗法旧疗法退热时间退热时间 秩号秩号 退热时间退热时间 秩号秩号 25 1 36 525 1 36 5 30 2 40 9 30 2 40 9 32 3 44 11 32 3 44 11 35 4 35 4 4848 13.5 13.5 37 6 50 15 37 6 50 15 39 39 7.5 56 16 7.5 56 16 3939 7.5 59 17 7.5 59 17 42 10 60 18 42 10 60 18 46 12 64 19 46 12 64 19 4848 13.5 195 20 13.5 195 20 240 21240 21 n n1 1=

25、10 T=10 T1 1=66.5 n=66.5 n2 2=11 T=11 T2 2=164.5=164.5两样本混两样本混合后统一合后统一编秩求得编秩求得秩号秩号分别求秩和分别求秩和8/28/20248/28/20243535医学统计学医学统计学- -秩和检验秩和检验三、分组求秩和并确定检验统计量三、分组求秩和并确定检验统计量当样本例数不等时,取当样本例数不等时,取较小例数组较小例数组的秩和为的秩和为统计量统计量T T;如;如n n1 1=n=n2 2,则取任一组秩和为统计,则取任一组秩和为统计量量T T。本例中。本例中: n n1 1=10 n=10 P, ,不拒绝不拒绝H H0 0;如果

26、;如果T T值恰好等于界值,值恰好等于界值,PP;如果;如果T T位位于检验界值区间外,于检验界值区间外,PP,拒绝拒绝H H0 0 ,接受接受H H1 1 。 8/28/20248/28/20243737医学统计学医学统计学- -秩和检验秩和检验在本例中,在本例中,T=66.5T=66.5,取,取=0.05=0.05,根据附表根据附表9 9双侧检验界值双侧检验界值0.010.01区间为(区间为(73,14773,147),),T T位于区间外,所以位于区间外,所以P0.01P0.01。P0.01Pn=100n2 2=50=50 T=T=例数例数例数例数较少组较少组较少组较少组对应的秩和对应的

27、秩和对应的秩和对应的秩和=T=T2 2=4338.5(T)=4338.5(T)8/28/20248/28/20245353医学统计学医学统计学- -秩和检验秩和检验根据公式根据公式根据公式根据公式(10-3)(10-3)计算计算计算计算u u根据根据根据根据C C根据根据根据根据t t界界界界值值表,表,表,表,P0.001PHHH, ,则则PPP;ii.ii.大样本情况:若大样本情况:若k k 3 3或或n ni i 5 5时,理论时,理论上,上,H H近似服从自由度为近似服从自由度为k1k1的的 分布,可查附表分布,可查附表7 7( 界值表)得界值表)得出出P P值,最后按值,最后按P P

28、值作出推断结论。值作出推断结论。8/28/202472秩和检验 本例处理数本例处理数k=3k=3,各组样本含量均为各组样本含量均为1010,超出了附表超出了附表1010(H H界值表)的范围。因此,查界值表)的范围。因此,查附表附表7 7( 界值表)确定界值表)确定P P值。值。 按自由度按自由度v=k-1=2v=k-1=2查附表查附表7 7, 0.005(2)0.005(2)=10.1018.12=10.1018.12,于是,于是P0.005P50) (n50)量量 独立:独立: WilcoxonWilcoxon two sample test two sample test T T 查表法

29、查表法资资 ( (mann-whitneymann-whitney test) test) 料料 多组多组- -完全随机:完全随机:kruskalkruskal-Wallis test -Wallis test H H ( (k k3 3且且n ni i5 5查查H H表表) ) n ni i55或或k3k3查查 界值表界值表 两两组:组: WilcoxonWilcoxon two sample test two sample test 多组:多组: kruskalkruskal-Wallis test-Wallis test两组两组等级资料等级资料8/28/20248/28/20247676医学统计学医学统计学- -秩和检验秩和检验

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号