分类变量资料统计推断 (卡方检验)课件

上传人:我*** 文档编号:141444465 上传时间:2020-08-08 格式:PPT 页数:55 大小:652KB
返回 下载 相关 举报
分类变量资料统计推断 (卡方检验)课件_第1页
第1页 / 共55页
分类变量资料统计推断 (卡方检验)课件_第2页
第2页 / 共55页
分类变量资料统计推断 (卡方检验)课件_第3页
第3页 / 共55页
分类变量资料统计推断 (卡方检验)课件_第4页
第4页 / 共55页
分类变量资料统计推断 (卡方检验)课件_第5页
第5页 / 共55页
点击查看更多>>
资源描述

《分类变量资料统计推断 (卡方检验)课件》由会员分享,可在线阅读,更多相关《分类变量资料统计推断 (卡方检验)课件(55页珍藏版)》请在金锄头文库上搜索。

1、分类变量资料的统计推断,新乡医学院公共卫生学系 李宏彬 Email: 0373-3831325,26. 检验,分布的概念,分布是一种连续型分布 (Continuous distribution),v 个相互独立的标准正态变量(standard normal var iable) 的平方和称为 变量,其分布即为 分布;自由度(degree of freedom)为v 。,26.1,3.84,7.81,12.59,P0.05的临界值,分布(chi-square distribution), 分布的图形为一簇单峰正偏态分布曲线 , 随着自由度的增加,正偏态的程度愈来愈小, 当自由度 时,曲线逼近于正

2、态曲线; 分布曲线下的面积有一定的规律, 一定 时,概率 P 愈小 值 愈大;概率 P 一定时 , 愈大 愈大。,分布特点,分布的分位数 (Percentile),当 确定后, 分布曲线下右侧尾部的面积为 时,横轴上相应的 值,记为 , ,如下图。实际应用时,可根据 由 界值表 查得。,例26.1某医师将病情相似的169名消化道溃疡患者随机分为两组,一组用洛赛克治疗,另一组用雷尼替丁治疗,4周后疗效见下表。问两种药物治疗消化道溃疡患的愈合率有无差别?,检验的基本思想,26.2,(以两个样本率的比较为例 ),本例资料经整理成上图形式,即有两个处理组,每个处理组的例数由愈合数和未愈合数两部分组成。

3、表内有四个基本数据,其余数据均由此四个数据推算出来的,故称四格表资料。,57.84,27.16,57.16,26.84,85(115/169)=(a+b)(a+c)/n,85(54/2169) =(a+b)(b+d)/n,基本思想:可通过 检验的基本公式来理解。,A为实际频数(actual frequency), T为理论频数(theoretical frequency)。,检验统计量 值反映了实际频数与理论频数的吻合程度。 若检验假设H0:1=2成立,四个格子的实际频数A与理论频数T 相差不应该很大,即出现大的 值的概率是很小的。如果 ,我们就怀疑H0成立,因而拒绝它,接受其对立假设H1,即

4、12 。,1. 建立假设,确定检验水准 H0 :1 = 2, 两种药物治疗消化道溃疡愈合率相同 H1 :1 2, 两种药物治疗消化道溃疡愈合率不相同 = 0.05 2. 计算检验统计量: 按 检验基本公式计算TRC,,检验的检验步骤,3.确定P值,做出推断 因 =4.133.84,P0.05。按=0.05检验水准,拒绝H0,接受H1,有统计学意义。因为洛赛克的愈合率为75.29%,雷尼替丁的愈合率为60.71%,可认为洛赛克的愈合率比雷尼替丁的愈合率。,26.3 四格表资料 检验,四格表资料 检验的专用公式,应用:用于两个样本率或 构成比资料的比较。 适用条件:当总例数n40且所有格子的T5时

5、。,四格表资料的 检验,用四格表资料 专用公式计算的 值:,26.4 值连续性校正,分布是一连续型分布,而四格表资料属离散型分布,由此计算得的 统计量的抽样分布亦呈离散性质。为改善 统计量分布的连续性,则进行连续性校正。,四格表资料 检验的校正公式,适用条件:当n40,但有1T5时。 最小理论频数TRC的判断:R 行与C列中,行 合计数中的最小值与列合计数中的最小 值所对应格子的理论频数最小。,将病情相似的淋巴系肿瘤患者随机分成两组,分别做单纯化疗与复合化疗,两组的缓解率见下表,问两疗法的总体缓解率是否不同?,例:,1. 建立检验假设,确定检验水准 H0 :1 = 2 , 两法总体缓解概率相同

6、 H1:1 2 , 两法总体缓解概率不同 =0.05 2.选择公式,计算检验统计量 因:n=4240,Tmin=101842=4.285 故用校正公式,3.确定P值,做出推断 因 =0.793.84,P0.05。按=0.05检验水准,不拒绝H0,无统计学意义。尚不能认为两种治疗方案总体缓解概率不同。,四格表资料的 检验公式的选用,当n40且所有的T5时, 用 ,或 当 时,用四格表资料的Fisher确切概率法.,四格表资料的 检验公式的选用,当n40,但有1T5时, 当 n40,或 T1时,用四格表资料的Fisher确切概率法。,配对四格表资料的 检验,与定量资料推断两总体均数是否有差别有成组

7、设计和配对设计一样,计数资料推断两个总体率(构成比)是否有差别也有成组设计和配对设计,即四格表资料和配对四格表资料。,应用:计数资料的配对设计常用于2种检验 方法、培养方法、诊断方法的比较。 特点:对样本中的各观察单位分别用2种方 法处理,然后观察2种处理方法的计 数结果。,配对四格表卡方检验,例:某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗核抗体进行测定,结果见下表。问两种方法的检测结果有无差别?,+,+,1. 建立检验假设,确定检验水准 H0 :B =C , 两种方法法检测结果相同 H1:B C , 两种方法法检测结果不同 =0.05 2.选择公式,计算检验统计

8、量,因:b+c=12+2=1440,故用校正公式,3.确定P值,做出推断 因 =5.793.84,P0.05。按=0.05检验水准,拒绝H0,接收H1,有统计学意义。可以认为两种方法的检测结果不同,免疫荧光法定阳性检测率较高。,配对设计,两种方法的检测结果,完全随机,两种方法的检测结果,关联性检验(独立性检验):同四格表 差异性检验,行列(RC)表资料的 检验,应用:行列表资料的 检验用于多个样本率的比较、两个或多个构成比的比较、以及双向无序分类资料的关联性检验。 其基本数据有以下3种情况: 多个样本率比较时,有R 行2列,称R2表; 两个样本的构成比比较时,有2行C 列,称2C表; 多个样本

9、的构成比比较,以及双向无序分类资 料关联性检验时,有R行C 列,称RC表。,行列表资料 检验的专用公式:,行列表卡方检验,应用条件:行列表中各格的理论频数不应小于1,并且1 T5的格子数不宜超过格子总数的1/5。,1. 多个样本率的比较 (Comparison of several rates ),例: 某医师研究物理疗法、药物治疗和外用膏药3种疗法治疗周围性面神经麻痹的疗效,资料见下表。问3种疗法的有效率有无差别?,表.三种治疗有效率的比较,1. 建立假设,确定检验水准 H0 : 三种治疗法周围神经麻痹有效率相等 H1:三种治疗法周围神经麻痹有效率不等或不全相等 取0.05。 2. 选择检验

10、方法,计算检验统计量: 因:T min = 51144532 = 13.805 故用行列表专用公式,3. 确定P值;做出推论: =(3-1)(2-1)=2;查 界值表P0.005按=0.05水准,拒绝H0 ,接受H1,有统计学意义。可以认为三种治疗法周围神经麻痹有效率不等或不全相等。,多个样本率比较,若所得统计推断为拒绝H0,接受H1时,只能认为各总体率之间总的来说有差别,但不能说明任两个总体率之间均有差别。要进一步推断哪两两总体率之间有差别,需进一步做多个样本率的多重比较。,三种疗法有效率的两两比较,2. 样本构成比的比较(comparison of several proportions)

11、,某医师在研究血管紧张素I转化酶(ACE)基因I/D多态与2型糖尿病肾病(DN)的关系时,将249例2型糖尿病患者按有无糖尿病肾病分为2组,资料见下表。问两组2型糖尿病患者的ACE基因型分布有无差别?,DN组与无DN组2型糖尿病患者ACE基因型分布的比较,1. 建立假设,确定检验水准 H0 : 两组总体构成比相同 H1: 两组总体构成比不同 取0.05。 2. 选择检验方法,计算检验统计量: 因:T min = 57111249 = 25.405 故用行列表专用公式,3.确定P值;做出推论: =(2-1)(3-1)=2;查 界值表0.01P0.025按=0.05水准,拒绝H0 ,接受H1,有统

12、计学意义。可以认为DN与无DN的2型糖尿病患者的ACE基因型分布不同。,RC 表 检验的应用注意事项,1. 对RC表,理论频数小于5的格子数不能超过总格子数的1/5;不能有小于1的理论频数。出现某些格子中理论频数过小时怎么办? (1)增大样本含量(最好!) (2)删去该格所在的行或列(丢失信息!) (3)根据专业知识将该格所在行或列与别的行或列合并。(丢失信息!甚至出假象) (4)Fisher确切概率法,2. 多个样本率经 检验,若拒绝H0 ,接受H1时,只能认为各总体率之间总的来说有差别,但不能说明任两个总体率之间皆有差别。要进一步推断哪两个总体率之间有差别,需进一步做多个样本率的多重比较。,3. 多组比较时,若效应有强弱的等级,如+,+,+,最好采用后面的非参数检验方法。2检验只能反映其构成比有无差异,不能比较效应的平均水平。(单向有序),4. 行列两种属性皆有序时,可考虑趋势检验 或等级相关分析。(双向有序),思考题,1. 检验的应用条件有哪些? 2.比较两独立样本频数分布的 检验,和 比较配对样本频数分布的 检验在资料 整理、假设检验等方面的差别是什么? 3.四格表资料、行列表资料2检验的注 意事项有哪些?,定量资料,定性资料,两个均数比较,多个均数比较:,两个率比较,多个率比较:,The end of this lectures,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号