秩和检验课堂PPT

上传人:新** 文档编号:580471518 上传时间:2024-08-29 格式:PPT 页数:49 大小:1.07MB
返回 下载 相关 举报
秩和检验课堂PPT_第1页
第1页 / 共49页
秩和检验课堂PPT_第2页
第2页 / 共49页
秩和检验课堂PPT_第3页
第3页 / 共49页
秩和检验课堂PPT_第4页
第4页 / 共49页
秩和检验课堂PPT_第5页
第5页 / 共49页
点击查看更多>>
资源描述

《秩和检验课堂PPT》由会员分享,可在线阅读,更多相关《秩和检验课堂PPT(49页珍藏版)》请在金锄头文库上搜索。

1、1一、参数统计与非参数统计参数统计与非参数统计的概念 从总体中随机抽取一定含量的样本,用样本指标估计(推断)从总体中随机抽取一定含量的样本,用样本指标估计(推断)总体指标,大体上有两种方法。一是参数统计,另一种是非参数总体指标,大体上有两种方法。一是参数统计,另一种是非参数统计。统计。1、参数统计、参数统计 指指在在总总体体分分布布类类型型已已知知的的条条件件下下,对对其其未未知知参参数数进进行行检检验验的的方方法法。要要求求独独立立、正正态态(方方差差齐齐),如如t检检验验、F检检验验均均属属于于参参数数统计。统计。2、非参数统计、非参数统计 主要采用符号或等级排列(秩排列)来代替数据本身的

2、分析主要采用符号或等级排列(秩排列)来代替数据本身的分析方法。方法。它适用于它适用于任何分布类型资料任何分布类型资料的统计分析。秩和检验就是一的统计分析。秩和检验就是一种非参数检验方法。种非参数检验方法。2适用条件参数统计参数统计: a. 样本所在总体呈正态分布样本所在总体呈正态分布 b.各总体方差要齐各总体方差要齐 c.各个样本是相互独立的随机样本各个样本是相互独立的随机样本非参数统计非参数统计:a. .总体分布为偏态或分布未知的计量资料;总体分布为偏态或分布未知的计量资料;b. .等级资料;等级资料;c. .个别数据偏大或小,一端或两端是不确定数值的资料(必选);个别数据偏大或小,一端或两

3、端是不确定数值的资料(必选);d. .各组离散程度相差悬殊,即各总体方差不齐。各组离散程度相差悬殊,即各总体方差不齐。3优 点参数统计:检验效能高(发现差别的能力,即把握度)。参数统计:检验效能高(发现差别的能力,即把握度)。非参数统计:非参数统计: a.适用于任何分布的资料适用于任何分布的资料 b.不受总体方差一致的限制不受总体方差一致的限制 c.可用于等级资料的统计分析可用于等级资料的统计分析 d.有些问题本身没有适当的参数检验方法,有些问题本身没有适当的参数检验方法, 而非参数检验则恰能处理而非参数检验则恰能处理4缺 点参数统计:易受使用条件的限制参数统计:易受使用条件的限制非参数统计:

4、非参数统计:a. 由于它没有充分利用原始数据中所提供的信息,由于它没有充分利用原始数据中所提供的信息, 故检验效能低故检验效能低 b.很多非参数统计检验方法都采用一些近似估计作很多非参数统计检验方法都采用一些近似估计作 出推断结论。因此,其结果有一定的近似性。出推断结论。因此,其结果有一定的近似性。5 参数检验与非参数检验比较参数检验与非参数检验比较参数检验参数检验 非参数检验非参数检验 资料服从正态分布资料服从正态分布 1 1、对资料没有特殊要求,总体为偏态、总体分布、对资料没有特殊要求,总体为偏态、总体分布未知的计量资料未知的计量资料2 2、等级资料、等级资料3 3、有过大、有过大/ /小

5、值的数据,或数据某一端没有具体值小值的数据,或数据某一端没有具体值4 4、总体方差不齐、总体方差不齐 检验效率高检验效率高 检验效率低,容易犯第二类错误,原因信息丧失或信检验效率低,容易犯第二类错误,原因信息丧失或信息利用不足息利用不足。 6秩和检验秩和检验第一节第一节 配对资料符号秩和检验配对资料符号秩和检验第二节第二节 两样本比较的秩和检验两样本比较的秩和检验第三节第三节 多个样本比较的秩和检验多个样本比较的秩和检验7秩次:观察值由小到大排列后得到的秩序号,当几 个数据大小相同时,取平均秩次作为其秩次。秩和:用秩次代替原始数据求和得到。秩和检验:用秩和进行假设检验的方法。8一、配对资料秩和

6、检验(Wilcoxon符号秩和检验法) 当配对设计计量资料不具备参数检验的适用条件,可采用符号秩和检验法。 它是将配对样本差值的中位数与0作比较9例:例:某研究者欲研究保健食品对小鼠抗疲劳作用,将同种属的小鼠按性别和年龄相同、体重相近配成对子,共10对,并将每对中的两只小鼠随机分到保健食品两个不同的剂量组,过一定时期将小鼠杀死,测得其肝糖原含量(mg/100g),结果见表10-1,问不同剂量组的小鼠肝糖原含量有无差别?10表表10-1 不同剂量组小鼠肝糖原含量不同剂量组小鼠肝糖原含量(mg/100g)number中剂量高剂量1620.16958.472866.50838.423641.2278

7、8.904812.91815.205738.96783.176899.38910.927760.78758.498694.95870.809749.92862.2610793.94805.4811 1、建立检验假设 H0:差值的总体中位数等于0,即Md0 H1:差值的总体中位数不等于0,即Md0 双侧=0.05 2、计算统计量T值检验步骤12(1 1)求差值:计算各对数据的差值)求差值:计算各对数据的差值(2 2)编秩:按差值绝对值由小到大编秩。编秩时差值为)编秩:按差值绝对值由小到大编秩。编秩时差值为0 0,则舍去,则舍去 不计;若差值的绝对值相等,称为相持,此时取平均秩次。不计;若差值的绝

8、对值相等,称为相持,此时取平均秩次。3 3、求秩和并确定统计量、求秩和并确定统计量T T: 将所有的秩次冠以原差值的符号,分别求出正负差值秩次之和,将所有的秩次冠以原差值的符号,分别求出正负差值秩次之和,分别以分别以T+, T表示。表示。 双侧双侧Tmin(T+,T);单侧任取其一为;单侧任取其一为T。本例本例T+=48.5;T=6.513number中剂量高剂量差值秩次1620.16958.47338.31102866.50838.42-28.08-53641.22788.90147.6884812.91815.202.291.55738.96783.1744.2166899.38910.9

9、211.543.57760.78758.49-2.29-1.58694.95870.80175.8599749.92862.26112.34710793.94805.4811.543.5144、确定P值和作出推断结论154 4、确定、确定P P值和作出推断结论值和作出推断结论 n表示差数不为表示差数不为0的对子数,本例:的对子数,本例:n=10。 当当n50时,查附表时,查附表9确定确定P值,该表中列出的是一个范围:值,该表中列出的是一个范围:16 在n=10处,有范围:847;由于T=6.5在此范围之外,即有:P0.05,拒绝H0,接受H1。认为差值的中位数 Md0。说明吃中剂量保健食品的小

10、鼠的肝糖原与吃高剂量保健食品的小鼠的肝糖原不一样。17二、单样本资料的符号秩和检验二、单样本资料的符号秩和检验 用于不满足t检验条件的单样本定量变量资料的比较。目的:推断样本中位数与已知总体中位数是否相等。18例例10-1 已知某地正常人尿铅含量的中位数为已知某地正常人尿铅含量的中位数为2.50mol/Lmol/L。 今在该地随机抽取今在该地随机抽取1616名工人,测得尿铅含量见表名工人,测得尿铅含量见表10-110-1第(第(1 1)栏。)栏。问该厂工人的尿铅含量是否高于当地正常人?问该厂工人的尿铅含量是否高于当地正常人? 表表10-1 10-1 某厂某厂1616名工人与当地正常人的尿铅含量

11、(名工人与当地正常人的尿铅含量(mol/Lmol/L)的比较)的比较尿铅含量尿铅含量差值差值秩次秩次尿铅含量尿铅含量差值差值秩次秩次0.623.130.783.272.133.542.484.382.544.382.685.052.736.083.0111.27191、建立假设检验,确定检验水准、建立假设检验,确定检验水准 H0:差值的总体中位数等于:差值的总体中位数等于0,即该厂工人的尿铅含量与正常人相同,即该厂工人的尿铅含量与正常人相同 H1:差值的总体中位数不等于:差值的总体中位数不等于0,即该厂工人的尿铅含量高于正常人,即该厂工人的尿铅含量高于正常人 单侧单侧 a=0.052、计算检验

12、统计量、计算检验统计量T值值(1)求差值)求差值(2)编秩:按照差值的绝对值由小到大编秩)编秩:按照差值的绝对值由小到大编秩(3)分别求正、负秩和,记为)分别求正、负秩和,记为T,T本例本例T=108,T=28(4)确定检验统计量:任取)确定检验统计量:任取T或或T为统计量为统计量T。20本例本例n=16,T=28或或T=108查附表查附表9,单侧,单侧0.05对应对应T临界值区间为临界值区间为35-101所以所以P0.05 按照按照a=0.05检验水准,拒绝检验水准,拒绝H0,接受,接受H1,故可认为,故可认为该厂该厂工人的尿铅含量高于正常人。工人的尿铅含量高于正常人。21 表表10-1 1

13、0-1 某厂某厂1616名工人与当地正常人的尿铅含量(名工人与当地正常人的尿铅含量(mol/Lmol/L)的比较)的比较尿铅含量尿铅含量差值差值秩次秩次尿铅含量尿铅含量差值差值秩次秩次0.62-1.88-123.130.6370.78-1.72-103.270.7782.13-0.37-53.541.0492.48-0.02-14.381.88122.54-0.0424.381.88122.680.1835.052.55142.730.2346.083.58153.010.51611.278.771622 当两个样本的方差不齐或不服从正态分布时,可以采Wilcoxon符号秩和检验对两个样本的差

14、别作比较。基本假设:1)两个样本分别来自互相独立的两个总体2)检验假设是两个总体分布相同二、两样本资料的秩和检验23定量变量两独立样本的秩和检验例:测量了甲乙两个河流断面亚硝酸盐氮的含量如下,问:两个河流断面亚硝酸盐氮含量的总体分布是否相同?241、建立检验假设 H0:甲乙两河流断面亚硝酸盐氮含量的总体分布相同 H1:甲乙两河流断面亚硝酸盐氮含量的总体分布不同 双侧=0.052、计算统计量T值25(1)编秩:将两组数据编秩:将两组数据混合混合, ,统一由小到大编秩,统一由小到大编秩,遇到相同数据取平均秩次。遇到相同数据取平均秩次。26(2)求秩和求秩和T T以以n n1 1表示样本含量较小的那

15、个样本的例数;表示样本含量较小的那个样本的例数; n n2 2表示样本含量较大的那个样本的例数。表示样本含量较大的那个样本的例数。则本例:则本例: n n1 1=10=10, n n2 2=15=15。 秩和秩和: T: T1 1=136=136;T T2 2=189=189若若n1n2,则任取一组的秩和为统计量;,则任取一组的秩和为统计量;若若n1n2,则以样本例数较小者对应的秩和为统计量。,则以样本例数较小者对应的秩和为统计量。本例本例n=10,T=136273 3、确定、确定P P值,作统计推断(附表值,作统计推断(附表1010)当当n110,n2-n110时,查附表得到时,查附表得到9

16、5%95%的的T T所在所在范围,当范围,当T T在此范围之中时,不拒绝在此范围之中时,不拒绝H H0 0;当;当T T在此范围在此范围之外时,拒绝之外时,拒绝H H0 0 本例:n1 =10, n2-n1=5,查附表,得范围:94166因为T=136在此范围之内,因而不拒绝H0,认为甲乙两个河流断面亚硝酸盐氮含量的总体分布相同。28有序分类变量两独立样本的秩和检验例:为了了解居民体内核黄素营养状况,于某年夏冬两个季节 收集成年居民口服5mg核黄素后4小时的尿负荷,测定体 内核黄素含量,结果见表10-3(1)、(2)、(3)栏, 试比较该地居民夏冬两个季节体内核黄素含量有无差别?29表表10-

17、3 某地居民夏冬两个季节体内核黄素营养状况比较某地居民夏冬两个季节体内核黄素营养状况比较核黄素营养状况例数夏季冬季缺乏1022不足1418适宜164合计404430表表10-3 某地居民夏冬两个季节体内核黄素营养状况比较某地居民夏冬两个季节体内核黄素营养状况比较核黄素营养状况例数合计秩次范围平均秩次夏季冬季缺乏10223213216.5不足141832336448.5适宜16420658474.5合计404484311 1、建立假设检验,确定检验水准、建立假设检验,确定检验水准 H H0 0:夏冬两个季节居民体内核黄素含量的总体中位数相等 H H1 1:夏冬两个季节居民体内核黄素含量的总体中位

18、数不相等 a=0.05a=0.052 2、计算检验统计量、计算检验统计量T T值值(1)编秩:将两组数据按等级顺序由小到大统一编秩(2)求各组秩和本例本例n n1 1=40=40,n n2 2=44=44T T1 1=16.5=16.5101048.548.5141474.574.516=203616=2036T T2 2=16.5=16.5222248.548.5181874.574.54=15344=153432(3 3)确定统计量:)确定统计量: T=T T=T1 1=2036=2036(4 4)确定)确定P P值,做出统计推断值,做出统计推断 本例本例n=40n=40,超出,超出T T

19、界值表可查范围,采用正态界值表可查范围,采用正态近似检验。近似检验。计算计算Z Z值。值。 查查t t界值表得界值表得P P0.050.05,按,按a=0.05a=0.05检验水准,拒绝检验水准,拒绝H H0 0,接受,接受H H1 1,差异有统计学意义,可认为夏冬两个季,差异有统计学意义,可认为夏冬两个季节居民体内核黄素含量有差别。节居民体内核黄素含量有差别。33三、多组独立样本的秩和检验三、多组独立样本的秩和检验 完全随机设计多组样本比较的非参数方法是完全随机设计多组样本比较的非参数方法是KruskalKruskal和和WallisWallis在在WilcoxonWilcoxon秩和检验的

20、基础上发展而来的,故又称秩和检验的基础上发展而来的,故又称K-WK-W检验或检验或H H检验。检验。检验目的:推断多组样本分别代表的总体分布是否不同。检验目的:推断多组样本分别代表的总体分布是否不同。基本步骤和两组连续变量资料秩和检验大致相同,只是确定基本步骤和两组连续变量资料秩和检验大致相同,只是确定的统计量不同。的统计量不同。34检验步骤:1、建立假设检验 H0:三组总体的分布相同 H1:三组总体的分布不全相同 =0.052、计算统计量H(1)编秩:三组混合编秩(2)求秩和:分别将各组秩次相加得到,记做R1 ,R2 ,R335(3)计算统计量363、确定P值,作出统计推断37 例例 研究白

21、血病时,测定四组鼠脾研究白血病时,测定四组鼠脾DNADNA的含量,结果列于下表,的含量,结果列于下表, 试分析各组试分析各组DNADNA含量有无差别?含量有无差别? 38建立假设检验建立假设检验H H0 0:四组鼠脾:四组鼠脾DNADNA含量的总体分布相同含量的总体分布相同H H1 1:四组鼠脾:四组鼠脾DNADNA含量的总体分布位置不全相同含量的总体分布位置不全相同 0.050.05计算统计量计算统计量假设检验步骤假设检验步骤39查表及结论查表及结论 现k k=4=4,= =k k-1=4-1=3-1=4-1=3查界界值表表 2 20.05(3)0.05(3)=7.81=7.81, 2 2

22、2 20.05(3)0.05(3); 0.050.05P0.05,暂不拒绝,暂不拒绝H H0 0,无统计学意义,无统计学意义,暂不能认为某药物对治疗组与对照组的疗效不同。暂不能认为某药物对治疗组与对照组的疗效不同。请问:该方法合适吗?如不合请问:该方法合适吗?如不合适,该使用何种方法?适,该使用何种方法?43正确的方法 由于该资料为由于该资料为单向有序单向有序列联表资料,欲比较两种药列联表资料,欲比较两种药物的疗效,如果采用物的疗效,如果采用RC表的表的 2 2检验,则反映不出两检验,则反映不出两种药物在疗效上的等级差别,因此正确的方法应该采种药物在疗效上的等级差别,因此正确的方法应该采用用秩

23、和检验秩和检验进行统计推断。进行统计推断。44检验方法的选择检验方法的选择(1)一组样本资料)一组样本资料 l (2)配对设计资料)配对设计资料 l 若来自正态总体,可用若来自正态总体,可用t检验;检验; 若来自非正态总体或总体分布无法确定,可用若来自非正态总体或总体分布无法确定,可用Wilcoxon符号秩和检验方法。符号秩和检验方法。 二分类变量,可用二分类变量,可用McNemar检验;检验; 连续型变量,若来自正态总体,可用配对连续型变量,若来自正态总体,可用配对t检验,否则检验,否则可用可用Wilcoxon符号秩和检验。符号秩和检验。45检验方法的选择(3)两组独立样本)两组独立样本 l

24、 连续型变量,若来自正态总体,可用连续型变量,若来自正态总体,可用t检验,否则,可用检验,否则,可用 Wilcoxon秩和检验;秩和检验; 二分类变量或无序多分类变量,可用二分类变量或无序多分类变量,可用x2检验;检验; 有序多分类变量,宜用有序多分类变量,宜用Wilcoxon秩和检验。秩和检验。46精品课件,你值得拥有精品课件,你值得拥有!47精品课件,你值得拥有精品课件,你值得拥有!48检验方法的选择(4)多组独立样本)多组独立样本 l 连续型变量值,来自正态总体且方差相等,可用方差分析;连续型变量值,来自正态总体且方差相等,可用方差分析;否则,进行数据变换使其满足正态性或方差齐的要求后,采用否则,进行数据变换使其满足正态性或方差齐的要求后,采用方差分析;数据变换仍不能满足条件时,可用方差分析;数据变换仍不能满足条件时,可用Kruskal-Wallis秩和检验。秩和检验。 二分类变量或无序多分类变量,可用二分类变量或无序多分类变量,可用x2检验。检验。 有序多分类变量宜用有序多分类变量宜用Kruskal-Wallis秩和检验。秩和检验。49

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号