t7t[高等教育]第九章 非参数检验

上传人:豆浆 文档编号:49471273 上传时间:2018-07-28 格式:PPT 页数:61 大小:436.50KB
返回 下载 相关 举报
t7t[高等教育]第九章 非参数检验_第1页
第1页 / 共61页
t7t[高等教育]第九章 非参数检验_第2页
第2页 / 共61页
t7t[高等教育]第九章 非参数检验_第3页
第3页 / 共61页
t7t[高等教育]第九章 非参数检验_第4页
第4页 / 共61页
t7t[高等教育]第九章 非参数检验_第5页
第5页 / 共61页
点击查看更多>>
资源描述

《t7t[高等教育]第九章 非参数检验》由会员分享,可在线阅读,更多相关《t7t[高等教育]第九章 非参数检验(61页珍藏版)》请在金锄头文库上搜索。

1、第九章第九章基于秩次的非参数检验基于秩次的非参数检验秩和检验秩和检验已知已知总体分布类型总体分布类型,对,对 未知参数(未知参数( 、 )进行进行 统计推断统计推断依赖于特定分布类依赖于特定分布类 型,型,比较的是参数比较的是参数 参数统计参数统计 (parametric statisticsparametric statistics)非参数统计非参数统计 (nonparametric statisticsnonparametric statistics)对总体的分布类对总体的分布类 型型不作任何要求不作任何要求 不受总体参数的影响,不受总体参数的影响, 比较分布或分布位置比较分布或分布位置

2、适用范围广;可用于任何类型适用范围广;可用于任何类型 资料资料( (等级资料,或等级资料,或“ “50mg”50mg” ) )对于符合参数统计分析条件者,采用 非参数统计分析,其检验效能较低 非参数统计的定义在实际工作中,有时对总体的分布类 型不易判定,或已知总体分布与检验所 要求的条件不符,也不能通过数据转换 使其符合参数统计的资料,这就需要一 种对总体分布不作严格规定,不依 赖总体分布类型,也不对总体参数 进行估计或检验的统计方法来分析 此类资料,称为非参数统计。3非参数统计的适用资料类型l 分布呈非正态而又无恰当的数据转换方 法使其转化为正态分布的资料(包含开口 资料)l方差不齐的资料l

3、总体分布不易确定的资料l不能或未加精确测量的资料,如等级资料 4秩和检验秩和检验(rank sum test):一类常用 的非参数统计分析方法;基于数据的秩次与 秩次之和。使用灵活,易于对各种设计类型 的资料进行假设检验;在原假设下统计量与 分布无关,有完备的大样本理论;秩和检验 与参数检验方法如t检验相比,其检验效率 不差,有时更好。 秩和检验的内容第一节 配对设计资料的符号秩和检验 第二节 完全随机化设计两组独立样本的秩和检验 第三节 完全随机化设计多组独立样本的秩和检验第一节 配对设计 的符号秩和检验7配对设计资料符号秩和检验基本思想对于配对设计的数值变量资料的比较可用符 号秩和检验(又

4、称差数秩和检验)。如果两 个总体分布的位置相同,这些配对数值之代 数差应服从于以0为中心的对称分布。8配对设计资料符号秩和检验基本思想也就相当于把这些数值按其绝对值大小 编秩并给秩次标上原来差值的符号后, 正秩和与负秩和在理论上应是相近的( 即差值为0)。即使实际计算中差值不为 0,也只是一些随机因素导致,不应过大 ,如果差值太大,超出界值范围,就应 该拒绝分布位置相同的假设。9配对资料的符号秩和检验的假设 :检验假设:差值的总体中位数等于0, 即H0:Md=0;备择假设:差值的总体中位数不等于0 ,即H1:Md0;10检验步骤1.建立假设2.求每对观察值的差值3.编秩求秩和4. 确定检验统计

5、量T5.确定P值,判断结果11编秩原则1.差值为0的差值不参与编秩。2.依差值的绝对值大小从小到大编秩。3.绝对值相同的差值取平均值。4.分别求正负秩和,T+和T-。5.检验编秩是否正确, T+T-n(n+1)/2。6.双侧检验使,以T+和T-中绝对值较小的T值 记为统计量T。单侧检验时,任取正差值的 秩和或负差值的秩和为统计量T。12P值的确定方法查表法适用条件: 5对子数n50时,查附表8 :T界值 表(配对比较的符号秩和检验用),注意:当 n0.05;如T位于T0.05界值的上限或下限外, P0.05;13P值的确定方法正态近似法适用条件:对子数n50时方法:可按式9-2和9-3计算统计

6、量u值,作正态 近似检验:14如果n不很大,统计量Z需要作如下的连续性 校正15如果出现多次取相同秩次的情况,应用公式9 -3进行校正:式(9-3)式中的tj为第j个相同秩次(计算绝对值)的 个数。16例题9.1l临床某医生研究白癜风病人的白介素IL-6 水平在白斑部位与正常部位有无差异, 调查的资料如表9-1所示:l对差值进行正态性检验,W0.843, P0.05三、下结论判断结果:按0.05检验水准P0.05, 不拒绝H0,差异无统计学意义,还不能认为 对23名有轻度牙周疾病的成年人,指导他们实行良好 的口腔卫生习惯,6个月后,牙周情况无显著好转。24第二节 完全随机化设计两组独立样 本的

7、秩和检验 Wilcoxon rank sum test对于计量数据,如果资料方差相等 ,且服从正态分布,就可以用t检验 比较两样本均数。如果此假定不成立或不能确定是否 成立,就应采用秩和检验来分析两样 本分别代表的总体分布是否相同。Wilcoxon秩和检验的基本思想假设两总体分布相同,两样本可认为时从同 一总体中抽取的随机样本;将两者混合后由 小到大编秩,然后分别计算两样本组的平均 秩和 ,它们应该大致相等,其差别 是由随机抽样引起;如果按上述方法计算的 两样本平均秩和差别很大,我们就有理由认 为H0不成立。26基本思想假定含量分别为n1 和n2的两个样本 ,来自同一总体(或分布相同的两 个总

8、体),则样本含量为n1 的样本 的T与理论上的秩和n1 (n+1)/2 一般应相差不大。27基本思想若n1 的T与理论上的秩和相差悬殊,超出 了附表9按 水准的界值范围(界值外) ,表示随机抽得现有样本统计量T值的概 率很小,因而在 水准上拒绝无效假设 H0;相反,若P大于 ,则不能拒绝无效 假设H0。28完全随机化设计两组独立样本 秩和检验的基本步骤1.建立假设2.编秩3.确定统计量T4.确定P值,判断结果29编秩原则1.将两样本观察值从小到大统一编秩2.观察值相同取平均秩次3. 分别求出两组的秩和4.检验编秩是否正确, T1+T2n(n+1)/2 。5.如n1 n2,取样本含量较小的样本的

9、秩和记 为统计量T。若两样本含量相等,就取较小 的秩和为统计量T。 30P值的确定方法查表法适用条件:n1(较小n)10,且n2 n110时;方法:根据n1(较小n)和n2 n1,查附表9 T界 值表(两样本比较的秩和检验用),得T界值范 围(下限和上限之间)。概率P的判断标准:T位于T0.05界值的上限和下限内,P0.05;T位于T0.05界值的上限或下限外,P0.05;31P值的确定方法正态近似法如果n1或n2 n11超出了附表9T界值的查询范围 时,可用正态近似法作检验,公式为:式(9-4)式中N=n1+n232当相同秩次较多时,按式9-4计算的u偏小,应采用 校正公式:式(9-5)式中

10、的tj为第j个相同秩次(计算绝对值)的个数。33一、两组连续变量资料的秩和检验 例题9-3l对无淋巴细胞转移与有淋巴细胞转 移的胃癌患者,观察其生存时间如 表9-4所示,问两组患者的生存时间 是否不同?34假设检验过程1.建立假设:H0 :两总体分布相同,或两总体分布位置相同;H1:两总体分布位置不同;2.确定显著性水平, 取0.05。3.编秩求秩和4.确定检验统计量T(查表法)5.将P值与比较,做出推论。35表9-4 两组患者生存时间(月) 无淋巴细细胞转转移有淋巴细细胞转转移时间时间秩次时间时间秩次124.5512510822711124.52912.5124.53817124.54219

11、1774620218462124956232912.560243014341536164018 4822n1=10T1=162n2=14T2=138 36确定检验统计量和P值的范围本例,n1=10,T1=162,查附表9,得双侧p0.0548P值的确定方法正态近似法当比较组数k或样本含量ni超出H界值表中的范围时,H的分布近似于自由度为k-1的 分布(k为比较的组数),可查附表7 界值表,将H值与 值比较,确定P值的范围。49一、多组连续变量资料的秩和检验 例题9.5l研究白血病时,测定四组鼠脾DNA的含 量,结果列于表9-6.试分析各组DNA含量 有无差别?l本例的对照组和A菌组均来自非正态

12、总体 ,不能用方差分析。50假设检验过程1.建立假设:H0 :四组鼠脾DNA含量的总体分布相同H1:四组鼠脾DNA含量的总体分布不同或不全相同;2.确定显著性水平, 取0.05。3.编秩求秩和4.确定检验统计量H5.将P值与比较,做出推论。51确定检验统计量和P值的范围本例,N=32,k4超出了H界值表的范围,需要与 界值进行比较。52三、下结论因为H19.90,所以P0.05判断结果:按0.05检验水准P0.05,拒绝H0,接受H1,差异有统计学意义,可以认 为四组鼠脾DNA含量的总体分布不同或不全相同。53二、多组有序变量资料的秩和检验 例题9.6l将霍乱菌苗用三种途径免疫21天后 血清抗

13、体滴度水平测定结果如表9-7 。问各组间的血清抗体滴度水平之 间的差异是否有统计学意义?54假设检验过程1.建立假设:H0 :三组血清抗体滴度水平的总体分布相同;H1:三组血清抗体滴度水平的总体分布不同或 不全相同; 2.确定显著性水平, 取0.05。3.编秩求秩和4.确定检验统计量H5.将P值与比较,做出推论。55确定检验统计量和P值的范围本例,N=96,而且取平均秩次的情况比较多,因此需 要计算校正的HC。超出了H界值表的范围,需要与 界值进行比较。56确定检验统计量和P值的范围57三、下结论因为HC12.27,所以P0.05判断结果:按0.05检验水准P0.05,拒绝H0,接受H1,差异

14、有统计学意义,可以认 为三组血清抗体滴度水平的总体分布不同或不全相同 。58小 结1. 非参数检验在假设检验中不对参数作明 确的推断,也不涉及样本取自何种分布的总体 。它的适用范围较广。常用的非参方法较为简 便。易于理解掌握。当资料适用参数检验方法 时,用非参常会损失部分信息,降低检验效能 。小 结2. 2. 秩和检验是通过对数据依小到大秩和检验是通过对数据依小到大 排列秩次,求秩和来进行假设检验的方排列秩次,求秩和来进行假设检验的方 法,可用于两独立样本比较、配对资料法,可用于两独立样本比较、配对资料 比较、多个独立样本比较、随机配伍组比较、多个独立样本比较、随机配伍组 比较等。比较等。小结 两两比较的问题对于多组独立样本的秩和检验,拒绝H0只能说各组总体分布不同或不全相同。若要明确哪两组间不同,还需要进一步做多组间的两两比较。 因为直接做两两比较,将增大I类错误的机会,所以需要根据比较次数修正检验水准。两两比较的检验水准应取0.05/比较次数。两两比较的方法可以参看其它统计学书籍。61

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号