[医学]卡方检验-研究生

上传人:tia****nde 文档编号:71022358 上传时间:2019-01-19 格式:PPT 页数:64 大小:499.91KB
返回 下载 相关 举报
[医学]卡方检验-研究生_第1页
第1页 / 共64页
[医学]卡方检验-研究生_第2页
第2页 / 共64页
[医学]卡方检验-研究生_第3页
第3页 / 共64页
[医学]卡方检验-研究生_第4页
第4页 / 共64页
[医学]卡方检验-研究生_第5页
第5页 / 共64页
点击查看更多>>
资源描述

《[医学]卡方检验-研究生》由会员分享,可在线阅读,更多相关《[医学]卡方检验-研究生(64页珍藏版)》请在金锄头文库上搜索。

1、2 检验 (Chi-square test) (3学时) 吴成秋 公共卫生学院卫生统计学教研室,2检验的应用,1.推断两个(多个)总体率或构成比之间是否有差别 2.多个样本率间的多重比较 3.两个分类变量之间有无关联性 4.频数分布拟合优度检验,一、2检验的基本思想,例7-1 某医生用两种疗法治疗前列腺癌,出院后随访3年,甲疗法治疗86例。乙疗法治疗95例,结果见下表。问两种疗法治疗前列腺癌病人的3年生存率是否有差别?,表10-7 甲乙两种疗法治疗前列腺癌的3年生存率 处 理 生存数 死亡数 合 计 生存率(%) 甲疗法 a52(46.09) b34(39.91) (a+b)86 60.47

2、乙疗法 c45(50.91) d50(44.09) (c+d)95 47.37 合 计 (a+c)97 (b+d) 84 (n)181 53.59 表中 为基本数据,称为实际频数,用AR.C表示, 表中 是根据A计算得到的,称为理论频数, 用TR.C表示。该资料称为四格表资料。,若假设两种疗法治疗前列腺癌病人的3年生存率相同,即 H0: 1=2= 53.59%,则 T1.1=8697/181=46.09 T1.2=8684/181=39.91 T2.1=9597/181=50.91 T2.2=9584/181=44.09,TR.C =nRnc,n,2 =(AT)2 = (R1)(C1) = (

3、21)(21)=1,T,假如H0: 1= 2成立,则A、T不会相差太大,那么2 会小;(A与T的差别是由抽样误差所致) 反之若检验假设H0不成立, 则A、T会相差很大,那么2会大;(抽样误差不能引起A与T如此大的差别) 判断结果,根据自由度的大小查2界值表 当2 2,时,P,拒绝H0,接受H1 当2 2,时,P ,不拒绝H0. 2反映了实际频数与理论频数的吻合程度,(一)、四格表的一般公式,二、一般四格表的2检验,2 =(AT)2 = (R1)(C1),T,以例10-7为例做2检验 H0: 1=2 即两种疗法治疗前列腺癌的3年生存率相同 H1: 12 即两种疗法治疗前列腺癌的3年生存率不相同

4、=0.05 T1.1=8697/181=46.09 T1.2=8684/181=39.91 T2.1=9597/181=50.91 T2.2=9584/181=44.09 2 =(AT)2 =(52-46.09)2+(34-39.91)2+(45-50.91)2+(50-44.09)2=3.11 =(21) (21)=1 查2界值表得 20.05,1=3.84, 20.05。按=0.05的水准,不拒绝H0,还不能认为两种疗法治疗前列腺癌的3年生存率不相同。,T,44.09,50.91,39.91,46.09,(二)、四格表的专用公式,当n40,T5时,用 2 =,(adbc)2 n,(ab)(

5、cd)(ac)(bd),a、b、c、d 为四格表的实际频数 (ab), (cd), (ac), (bd)是四格表周边的合计数 n=abcd, 为总的样本含量 对例10-7的计算 2 = =3.11,(5250-3445)2181,(86959784),显然,计算结果与前相同,但该法避免了计算理论数的麻繁,(三)、四格表的校正公式,1.2检验的应用条件 (1)当n40且T5时,用2检验的基本公式或四格表的专用公式;当P时,改用四格表的确切概率法。 (2)当n40时但有1T5时,用四格表2的校正公式或用四格表的确切概率法 (3)当n40时,或T1时,用四格表的确切概率法 2.四格表2的校正公式,2

6、 =(AT0.5)2,T,2 =,(adbcn/2)2 n,(ab)(cd)(ac)(bd),例7-2某医师用两种疗法治疗心绞痛,结果如表10-10,问两种疗法的疗效有无差别? 表10-10 两种疗法治疗心绞痛的效果率,H0: 1= 2 即两种疗法的疗效相等 H1: 1 2 即两种疗法的疗效不等 =0.05 T=299/59=4.42(计算行合计和列合计均为最小的理论数) c2 = =0.61 =1,查2界值表得, P0.05。按=0.05的水准不拒绝 H0, 尚不能认为两种两种疗法的疗效不等.,( 233627 59/2)259,2930509,三、配对四格表资料的2检验,配对四格表资料的2

7、检验是对配对设计研究所获得的资料为计数资料进行比较。,配对设计包括: 同一批样品用两种不同的处理方法 观察对象根据配对条件配成对子,同一对子内的不同个体分别接受不同的处理 在病因或危险因素的研究中,将病人和对照按配对条件配成对子,研究是否存在某种病因或危险因素。,观察的结果只有阳性、阴性两种可能,清点成对资料时只有四种情况: a:甲+乙+ b:甲+乙- c:甲-乙+ d:甲-乙- 列成下面四格表,适用于配对设计的计数资料 配对资料的结果有 甲 乙 结果 a b c d,配对设计的计数资料,2 =(bc)2/(bc), =1, (bc) 40 c2 = ( bc 1)2/(bc), =1 (bc

8、) 40,例 对120名确诊的乳腺癌病人,分别用甲乙两种方法来检测,甲方法检出阳性率为60%,乙方法检出阳性率为50%,甲乙一致检出阳性率为35%,问甲乙两方法检出阳性率有无差别?,表: 两种方法的检测结果,H0:B=C (1= 2) H1:B C (1 2) =0.05,bc= 3018=4840 2 =(3018)2/(3018)=3.0 =1,查 2界值表得 P0.05 。按=0.05水准,不拒绝H0 ,还不能认为两种方法的检验结果不同。,配对四格表资料的关联性检验(P761),H0:两种方法无关(无一致性) H1:两种方法有关(有一致性) =0.05 2 两种方法检测结果的相关系数r

9、r必定等于kappa检验的kappa值,K0.75 一致性好 0.40k 0.75 一致性较好 K0.40 一致性差,例73 某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗体进行测定,结果见表73。问两种方法的检验结果有无差别? 表73 两种方法的检测结果,H0:B=C H1:B=C =0.05,bc=124=1440 c2 =( 122 1)2/(122)=5.79 =1,查2界值表得 0.01P0.025 。按=0.05水准拒绝H0 ,接受H1, 认为两种方法的检验结果不同,免疫荧光法的阳性检出率较高。,四、行列表资料的2检验,可以用于多个率及多个构成比资料的比较

10、和双向无序分类资料关联性检验。其基本数据有三种情况: 1、多个样本率比较。有R行2列,称为R2表 2、两个样本的构成比比较,有2行C列,称为2C表 3、多个样本的构成比比较,以及双向无序分类资料关联性检验,有R行C列,称为RC表,行列表检验的专用公式 2=n(A2/nRnC1) = (R1)(C1),(一)多个样本率的比较,例7-6 某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资料见表7-8。问三种疗法的有效率有无差别? 表7-8 三种疗法有效率的比较,H0 :1=2= 3,即三种疗法的有效率相等 H1 :三种疗法的有效率不全相等 =0.05 2 =532(199

11、2/20648172/20651262/144511) =21.04 = ( 31)( 21) = 2 查2界值表:得P0.005.按 =0.05 拒绝 H0,接受H1,可以认为三种疗法治疗周围性面神经麻痹的有效率有差别。,(二)样本构成比的比较 例7-7 某医师在研究血管紧张素转化酶(ACE)基因I/D多态与2型糖尿病肾病(DN)的关系时,将249例型糖尿病患肾病分为两组,资料见表79。问两组型糖尿病患者的ACE基因型总体分布有无差别? 表7-9 DN组与无DN组型糖尿病患者ACE基因型分布,H0 :两组2型糖尿病患者ACE基因型的总体构成比相同 H1 :两组2型糖尿病患者ACE基因型的总体

12、构成比不同 =0.05 按公式(710)计算 2=249(422/11172482/111120362/138571) =7.91 = (21) (31)=2 查2界值表得0.01P0.025。按=0.05拒绝H0, 接受H1,认为DN与无DN的2型糖尿病患者的ACE基因型分布不同。,(三)双向无序分类资料的关联性检验,例7-8 测得某地5801人的ABO血型和MN血型结果如表7-10,问两种血型系统之间是否有关联? 表7-10 某地5801人的血型,H0:两种血型系统间无关联 H1:两种血型系统间有关联 =0.05 2=58014322/(18231451)4902/(18231666) 3

13、22/(3482684)1=213.16 = (41)(31)=6 查2界值表得P0.005。按=0.05拒绝H0 ,接受H1,认为两种血型系统间有关联。,若需进一步分析关系的密切程度时,可计算Pearson列联系数C C取值范围在01之间。 0 表示独立: 1 表示完全相关; 愈接近于0,关系愈不密切, 愈接近于1,关系愈密切。,(四)、行列表资料检验的注意事项,1、理论频数T不应太小; 不宜有1/5以上的格子1T5; 不宜有一个格子的T1 若出现上述情况,处理的方法有: (1)最好是增加样本的含量(继续观察),使T增加 (2)根据专业知识,考虑能否删去T太小的行或列,或T太小的行间或列间,

14、进行合理的合并,(3)改用双向无序表的确切概率法 2、多个率比较,若所得统计推断为拒绝 H0,接受H1时,只能认为各总体率之间总的来说有差别。要进一步推断哪两两总体率之间有差别,需进一步做多个样本率的多重比较。 3、对于有序的RC表资料不宜用 2检验(见后),(五)RC表的分类及其检验方法的选择,1、双向无序RC表: RC表中两个分类变量皆为无序分类变量,如表7-8、7-9、7-10。对于该类资料: 若研究目的为多个样本率(或构成比)的比较,可用R2表资料的2检验 若研究目的为分析两个分类变量之间有无关联性以及关系的密切程度时,可用RC表资料的2检验以及Pearson列联系数进行分析。,2、单向有序RC表: 有两种形式 RC表中的分组变量是有序的(如年龄),而指标变量是无序的(如传染病的类型),其研究目的通常是分析不同年龄组各种传染病的构成情况,此种单向有序RC表资料可用行列资料的2检验。 RC表中的分组变量为无序的(如疗法),而指标变量是有序的(如疗效按等级分组),其研究目的为比较不同方法的疗效,此种单向有序RC表资料宜用秩和检验进行分析。,3、双向有序属性相同的RC表: RC表中的两分类变量皆为有序且属性相同。实际上是22配对设计的扩展,即水平数3的诊断试验配伍设计,如用两种检测方法同时对同一批样品的测定结果

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号