2019/11/9,潍坊医学院 卫生统计学教研室,1,,,前面学习了连续型资料假设检验方法(t检验、方差分析)等 如果各样本所来自总体的分布不清、已知不服从正态分布或经变量转换后仍不服从正态分布时,如何进行检验呢? ★需要一种不依赖于总体分布类型的检验方法,非参数检验方法-Nonparametric test 问题的提出:,2019/11/9,潍坊医学院 卫生统计学教研室,2,,,掌握参数统计、非参数统计的概念; 掌握非参数统计法的优缺点、适用范围; 掌握各秩和检验的编秩原则与判断方法; 了解秩和检验与参数检验方法的检验效能的差别学习目标,2019/11/9,潍坊医学院 卫生统计学教研室,3,,,一、参数统计(Parametric statistics) 对于总体分布类型已知的资料,用相应于参数的统计量来估计参数所在范围或推断参数有无差别的统计方法如t检验, F检验, Z检验等,第一节 参数检验与非参数检验,参数检验的特点 针对总体参数进行估计或检验; 要求总体分布已知; 统计量有明确的理论依据; 有严格的使用条件参数检验,参数检验方法:t 检验,方差分析; 总体分布假定:各组样本所来自的总体为正态分布(已知的分布形式),各组样本所来自的总体方差齐性。
2019/11/9,潍坊医学院 卫生统计学教研室,5,,,二、非参数检验(Nonparametric statistics) 对总体分布类型不作要求,而对总体的分布或分布位置进行检验亦称任意分布检验(Distribution-free test) 特点:适用范围广 受限条件少 稳健性好 方法简便,易于理解和掌握,第一节 参数检验与非参数检验,参数统计 (parametric statistics),非参数统计 (nonparametric statistics),三、非参数统计方法的优缺点,非参数检验的缺点:,其检验效能较低仅是参数统计的95%利用资料信息不充分 对于符合参数统计分析条件者,采用参数统计分析10、15、20 秩和=6 20、50、80 秩和=6,四、非参数统计方法适用范围 1、计量非正态资料; 2、偏态分布资料; 3、总体分布类型未知或不确定资料; 4、等级资料; 5、开口资料. ※符合参数统计条件的首先应用参数统计方法 ※不符合参数统计条件的,经变量变化后应用参数统计方法;若仍不符合参数统计条件的,应用非参数统计方法.,秩次(rank):某种测量值按照从小到大的顺序排序后,每个测量值所对应的序号。
秩和检验基本思想—(秩转换) :基于秩次,通过编秩,用秩次代替原始数据信息进行校验,即检验各组的平均秩是否相等,判断分布位置有无差别秩转换的非参数检验-秩和检验,2019/11/9,潍坊医学院 卫生统计学教研室,10,,,第二节 两相关样本Wilcoxon符号秩检验,Wilcoxon符号秩检验简介,应用: 1.两相关样本资料Wilcoxon符号秩和检验 2.单样本资料Wilcoxon符号秩和检验,Frank Wilcoxon,由Wilcoxon于1945年提出;,一、两相关样本资料Wilcoxon符号秩和检验 应用:配对设计定量资料样本差值的中位数与0比较;,配对设计两组处理效应的比较:当差值服从正态分布时,采用配对t 检验;如果差数严重偏离正态分布,可采用Wilcoxon符号秩检验配对设计资料的数据表达形式,Wilcoxon符号秩检验的基本思想,假定某种处理无作用,则每一个受试对象处理前后所得结果之差值的总体中位数M亦为0 在H0成立(两配对样本差值的总体中位数为0)的条件下,两配对样本的差值的正负及其绝对值的相对大小是随机的;在此情况下,正秩和与负秩和之间应当相近,差别不会太大; 如果正秩和与负秩和之间相差足够大,则可认为H0成立的可能性很小,从而加以拒绝。
例9.1:某医院检验科试用新旧两种方法检测丙氨酸氨基转移酶,新方法的检测时间由20分钟缩短为10分钟用两种方法检测同一份血清,结果见表9.1第(2)、(3)栏,问两法测得结果有无差别?,表9-1 两种方法测定血清谷-丙转氨酶(nmol/s/L),表9-1 两种方法测定血清谷-丙转氨酶(nmol/s/L),,,,二、检验步骤 1、建立假设,确定检验水准 H0:差值总体中位数Md = 0 H1:差值总体中位数Md ≠ 0 α =0.05 2、计算统计量T: (1)求差值 (2)编秩,编秩原则: ①依差值绝对值大小,从小到大依次编秩,并冠以“+” 或“-” 号; ②若差值绝对值相等: 符号相同,可以顺编,可以求平均秩次 符号不同,必须求平均秩,再冠以+、-号; ③若差值为零,去掉,对子数相应减少 (3)正负秩次分别求和,以T+和T-表示 (4)任取T+或T-为统计量表9-2 两种方法测定血清谷-丙转氨酶(nmol/s/L),(2+3)/2=2.5,,,(5+6)/2=5.5,,,,表9.2 两种方法测定血清谷-丙转氨酶(nmol/s/L),T+ =11 T— =44,,,,判断标准:“内大、外等小”。
即若T在上下界值范围内,则P值大于相应的概率,即为 “内大” 若T在上下界值范围外(或等于界值),则P值小于(或等于)相应的概率,即为“外等小”3、确定P值大小,做出结论,(1)查表法:5≤n≤50时,查T界值表(p422),本例结果分析:,本例取正秩和,则T+ =11; 查T界值表,双侧α =0.05的界值为8~47,本例T=11 ,故 P0.05; 结论:不拒绝H0,尚不能认为两种方法检测血清中丙氨酸氨基转移酶含量的结果有差别当 n 50时,可用正态近似法作 u 检验,分子中的0.5是连续性校正数,这种校正一般影响较小,常可省去2)正态近似法(n50),,,,,当 n 50且有相同秩号较多时,用正态近似法作 u 检验校正公式,二、单样本资料的Wilcoxon符号秩和检验 Wilcoxon signed rank test,应用:单个样本中位数M和已知总体中位数(给某一定值)的比较,例:已知某地正常人尿氟含量中位数为45.3 μmol/L,某厂12名工人与当地正常人的尿氟含量比较,假设检验过程:,与配对资料Wilcoxon符号秩检验假设检验步骤, 编秩步骤基本相同 ●先计算每一测量值与给定值的差数:di=xi-45.3; ●然后对差数进行编秩,与配对资料符号秩检验完全相同。
此例得T=1.5,查表得P0.005; 拒绝H0,认为该厂工人的尿氟含量高于当地正常人的水平2019/11/9,潍坊医学院 卫生统计学教研室,28,,,Wilcoxon秩和检验(rank sum test)用于推断计量资料或等级资料的两个独立样本所来自总体的分布位置是否有差别简化为对两总体中位数M的比较 适用资料: 两定量非正态资料 或两组有序分类(等级)资料第三节 两个独立样本比较的 Wilcoxon秩和检验,基本思想,任一组秩和不应太大或太小,假定H0成立:,与平均理论秩和 N(N+1)/4 应相差不大,,,,混合编秩,分别计算两组的秩和,例9.2:某医生欲比较某新疗法与传统疗法治疗肾综合征出血热患者的降温效果,将病人随机分为两组,分别以新疗法与传统疗法治疗,以用药开始的体温降至正常值时所用的时间(小时)为疗效指标(每天固定时间测量体温四次),假定影响退热时间的混杂因素在所比较的两组间均衡,结果见表9-5,试比较两种疗法的退热时间有无差别?,表9-5 两种疗法的退热时间(h),,,,(1)建立检验假设,确定检验水准,H0:两总体分布位置相同 H1:两总体分布位置同不同 α=0.05,(2)混合编秩,求统计量T,编秩原则: (1)两组数据混合按升序编秩 (2)如有相同数据在不同组时,求平均秩次。
(3)两组数据分别求秩和 (4)统计量的确定 : n1=n2,则以任一组秩和为统计量T n1≠n2, 以n小者的秩和为统计量T,表9-5 两种疗法的退热时间(h),,,,(3)确定P 值,作出结论,若n1≤10且n2-n1≤10,通过查T 界值表(附表9)确定P值; 若两样本量不满足上述条件,则可采用正态近似法作u检验正态近似法,,,分子中的0.5是连续性校正数,这种校正一般影响较小,常可省去相同秩次较多时,需采用以下公式进行校正结果分析:,本例n1=10, n2-n1=1,本例取n1=10组的 T值,T1=66.5,满足查T 界值表的条件; 查表得双侧0.05时T界值为:81-139; 拒绝H0 ,接受H1 ,认为两种疗法对肾综合征出血热患者的退热时间的总体分布位置不同 也可以用两独立样本比较Mann-Whitney U检验(自学了解),2019/11/9,潍坊医学院 卫生统计学教研室,39,,,Kruskal-Wallis H检验用于推断计量资料或等级资料的多个独立样本所来自总体的分布位置是否有差别第四节 多组独立样本比较的秩和检验,William Kruskal,W. Allen Wallis,有序分类资料和不满足方差分析条件的完全随机设计多组资料比较,采用Kruskal-Wallis-H秩和检验(类似于方差分析)。
适用资料: ▲多组连续变量非正态分布资料 ▲多组有序(等级分组)资料例9.3 某研究者欲研究A、B两种菌对小鼠巨噬细胞吞噬功能的激活作用,将59只小鼠随机分为三组,其中一组为生理盐水对照组,用常规巨噬细胞吞噬功能的监测方法,获得三组的吞噬率(%),结果见表9.8,试比较不同实验条件下小鼠巨噬细胞的吞噬率有无差别?,(1)建立检验假设,确定检验水准,H0:三个总体分布位置相同 H1:三个总体分布位置不全相同 α=0.05,(2)混合编秩,分组求秩和,求统计量H,将多组样本数据混合从小到大排序、编秩 ; 观察值相等但在不同组时,取平均秩次; 分别计算各组样本的秩和Ri及样本量ni;,,当相同秩次较多时,需校正3)确定P值,作出结论,若组数k=3且每个样本例数ni≤5时,可通过查H界值表(附表10)确定P值; 若组数k=3且最大样本例数5或k3时,则H或Hc近似服从ν=k-1的卡方分布,可通过查卡方界值表确定P值结果分析:,本例v=2,每组例数均大于5,查卡方界值表,得 故P0.005,拒绝H0,接受H1,认为三组菌种对小鼠巨噬细胞的吞噬率差别有统计意义,即可认为不同菌种对小鼠巨噬细胞的吞噬率的作用不同。
2019/11/9,潍坊医学院 卫生统计学教研室,48,,,第五节 多组相关样本资料比较秩和检验,自学:,多组相关样本资料,也称为区组设计资料,或配伍组设计资料当资料不满足方差分析条件时,可采用Friedman M秩和检验2019/11/9,潍坊医学院 卫生统计学教研室,49,,,第六节 等级资料的比较,一、两组等级资料的比较,两组等级资料,其检验步骤与(第二节)两独立资料的Wilcoxon秩和检验相似,不同的是需要计算各等级的秩次范围、平均秩次例9.5 用某药治疗不同病情(单纯型和合并症型)的老年慢性支气管炎病人,疗效见表9.15第(2)、(3)栏,问该药对两种病情的疗效有无差别?,表9-15 某药对支气管炎两种病情疗效的秩和检验,,,(1)建立检验假设,确定检验水准,H0:两种病情患者的疗效总体分布位置相同 H1:两种病情患者的疗效总体分布位置不同 α=0.05,(2)混合编秩,求统计量确定各等级的合计人数; 根据各等级的合计人数确定其秩次范围和平均秩; 分别计算两样本的秩和T1和 T2; 取n较小的秩和(T)作为统计量T ; 根据公式(9-3)计算u值,进行u检验表9-15 某药对支气管炎两种病情疗效的秩和检验,,,平均秩次=(秩次范围上限+秩次范围下限)/ 2,结果分析:,本例n1=126, n2=82,N=126+82=208, T=T1=8780.5;,查附表1,|u0.05/2|= 1.96, 故P0.0。