第八章分类资料描述x2检验

上传人:杰猫 文档编号:119405221 上传时间:2020-01-14 格式:PPT 页数:93 大小:993.51KB
返回 下载 相关 举报
第八章分类资料描述x2检验_第1页
第1页 / 共93页
第八章分类资料描述x2检验_第2页
第2页 / 共93页
第八章分类资料描述x2检验_第3页
第3页 / 共93页
第八章分类资料描述x2检验_第4页
第4页 / 共93页
第八章分类资料描述x2检验_第5页
第5页 / 共93页
点击查看更多>>
资源描述

《第八章分类资料描述x2检验》由会员分享,可在线阅读,更多相关《第八章分类资料描述x2检验(93页珍藏版)》请在金锄头文库上搜索。

1、2检检 验验 Chi-square test 孔丹莉 广东医学院 医学统计与流行病学教研室 第十章第十章 1 主要内容 第一节 分类变量资料的统计描述 (复习) 第二节 分类变量资料的统计推断 (复习) 第三节 卡方检验 (Chi-square test) 2 第一节 分类变量资料的统计描述 1. 常用相对数 2. 应用相对数时的注意事项 3 什么是分类变量资料?清点分类资料得数据清点分类资料得数据 用什么指标进行描述? 甲、乙两地发生麻疹流行,甲地患儿100人,乙地患儿50人 ,何地较为严重? 若甲地易感儿童667人,而乙地易感儿童250人。 甲地麻疹发病率为 100/667100%=15%

2、 乙地麻疹发病率为 50/250100%=20% 用相对数能较好地反映分类变量资料的特征。用相对数能较好地反映分类变量资料的特征。 4 1. 常用相对数 相对数:是两个有关联的数值或指标之 比。 常用的相对数有: 率 构成比 相对比 5 (1) 率 (rate) 率:是指在一定观察时间内,某现象实际发生数与 可能发生该现象的总数之比,用以说明某现象发生 的频率或强度。 K为比例基数,如100%、1000等。比例基数的选择主要依 习惯而定或使计算结果能保留12位整数。 6 例 某研究组在北方城镇调查了1450人,其中976人经常 吸烟(日平均1支以上),在南方城镇调查了1806人, 有1052人

3、经常吸烟, 试计算南北方城镇25岁以上男性居 民的吸烟率。 城镇男性吸烟率: 北方 976/1450100%=67.31%, 南方 1052/1806100%=58.25%。 南北方合计: (67.31%+ 58.25%)/2=62.78% (976+ 1052)/(1450+ 1806) 100%=62.28% 7 (2) 构成比(constituent ratio) 构成比:是指事物内部某一部分的观察单位数与事 物内部各组成部分的观察单位数总和之比,用以说 明事物内部各部分所占的比重或分布。 常用百分数表示,故又称百分比。 8 各部分构成比之和为100%。 此消彼长。 构成比的两个特点:

4、9 例10-1 2001年对某地中小学学生进行HbsAg检查 ,结果见表10-1,试计算各级学生HbsAg检出率及 阳性者构成比 率和构成比不是同一指标,在应用时应注意加以区分。 10 类 型例数死亡例数 病死率 (%) 构成比 (%) 肺炎胸膜炎型 75 1216.0 42.9 中毒败血型 36 7 19.4 25.0 中毒休克型 14 964.3 32.1 合 计1352820.7 100.0 三种类型疾病病死率和构成比 什么类型疾病病死危险大? 11 (3) 相对比 相对比:指两个有关指标之比,说明两个指标的比 例关系。 两个指标可以是绝对数、相对数、平均数,可以是性质相同 或性质不同,

5、但两个指标互不包含。 12 例10-2 某地2003-2005年不同性别新生儿数见表10 -2,试计算该地不同年份新生儿性别比。 13 2. 应用相对数的注意事项 计算相对数时分母不宜过小 正确区分构成比和率,不能以构成比代替率 正确计算平均率 对率和构成比进行比较时,应注意资料的可 比性(除研究因素外,其余重要因素应相同或相近) 样本率或构成比进行比较时要作假设检验 14 在进行率或构成比比较时,除了要比较的因素外,其他影响 的因素应基本一致。 例如,分析比较两医院病死率的时,应注意两个医院的条件 应基本相同,如果上级医院的病死率高于基层医院的病死率 ,并不能说明上级医院医疗水平不如基层医院

6、,这是因为许 多疑难病人均由基层医院转入上级医院所致。 当比较两个总率时,若其内部构成不同,需要进 行率的标准化。 15 第二节第二节 分类变量资料的统计推断分类变量资料的统计推断 率的抽样分布 率的抽样误差与标准误 总体率的区间估计 率比较的u检验 16 1. 率的抽样分布 二项分布(binomial distribution)的概念 例:假设注射某种免疫疫苗会有10%的 人出现不适反应。问3人接种后各种可能后果 的概率是多少? 17 18 贝努利试验(Bernoulli trials ): n次独立、重复试验(每次试验只出现A和 之一,每次概率都是 和 )。 贝努利试验中,事件A可能发生0

7、, 1, 2, , n 次,A 恰好发生k次的概率为 19 二项分布 (binomial distribution): 若随机变量X只能在 中取值,各种可能值的概率满足前式, 我们就说X服从参数为n和的二项分布, 记为 20 已知: =0.5,n =10; =0.3,n =5; =0.3,n =10; =0.3,n =15。 试根据式(10-6)求各阳性数事件的概率并 作概率分布图。 21 图10-1 率的抽样分布图 (二项分布) 率的抽样分布特征: 1.为离散型分布; 2.当 =1-时,呈对称分布; 3.当n 增大时,逐渐逼近正态分布。 一般认为,当n和n(1-)5时, 可近似看作正态分 布

8、。 22 2. 率的抽样误差和标准误 由于抽样所引起的样本率和总体率或各样本 率之间存在着差异,这种差异称为率的抽样误差 。用率的标准误表示。 23 3. 总体率的区间估计 总体率的估计: 点估计 区间估计 正态近似法 查表法 24 正态近似法 当样本含量n足够大,样本率p或1-p均不太小时(如np和 n(1-p)均大于5),样本率的分布近似正态分布。 u是标准正态分布双侧临界值,在估计总体率的95% 置信区间时,其值为1.96;99%置信区间时,其值为2.58 。 25 95%的置信区间: 38.47%1.961.16%=36.20%40.74% 99%的置信区间: 38.47%2.581.

9、16%=35.48%41.46% 例如某地人群中结核菌素试验阳性率95%和99%的 置信区间为: 26 查表法 当n较小,如n50,特别是p接近于0或1时,按二 项分布原理估计总体率的可信区间。 因其计算比较复杂,统计学家已经编制了总体率 可信区间估计用表,可根据样本含量n和阳性数x查阅统 计学专著中的附表 。 27 4. 两样本率比较的u 检验 当样本含量n足够大,样本率p或1-p均不 太小时(如np和n(1-p)均大于5),样本率的 分布近似正态分布。样本率和总体率之间、 两个样本率之间的比较可用u检验(u test) 。 28 表5-1 两种疗法的心血管病病死率比较 疗疗法死亡生存 合计

10、计病死率(%) 盐盐酸苯乙双胍26 (X1)178 204(n1) 12.75 (p1) 安慰剂剂 2 (X2) 62 64(n2) 3.13 (p2) 合 计计 28240 268 10.45 (pc) u 检验的条件: n1p1 和n1(1- p1)与 n2p2 和n2(1- p2)均 5 样本率与总体率的比较 30 两个样本率的比较 31 小 结 1样本率也有抽样误差,率的抽样误差的大小用 p或sp来衡量。p越大,率的抽样误差越大。 2率的分布服从二项分布。当n足够大,和1-均 不太小,有n5和n(1-)5时,近似正态分布。 32 3总体率的置信区间是用样本率估计总体率的 可能范围。当p

11、分布近似正态分布时,可用正态近 似法估计率的置信区间。 4根据正态近似原理,可进行样本率与总体率 以及两样本率比较的u检验。 33 率的u 检验检验 能解决以下问题吗问题吗 ? 率的反应为生与死、阳性与阴性、发生与不 发生等二分类变量,如果二分类变量为非正反关 系(如治疗A、治疗B);反应为多分类,如何进 行假设检验? 率的u 检验要求:n足够大,且n5和 n(1-)5。 如果条件不满足,如何进行假设检验? 第三节第三节 2 检验(Chi-square test) 基本思想 四格表资料的卡方检验 配对设计分类变量资料的卡方检验 行列表资料的卡方检验 35 2检验(Chi-square test

12、) t 是现代统计学的创始人之一,英国 统计学家K.Pearson于1900年提出的 一种具有广泛用途的假设检验方法。 常用于分类变量资料的统计推断,可 用于两个或多个率间的比较,计数资 料的关联度分析,拟合优度检验等等 。 36 例例10-110-1 为比较西药与中药治疗慢性支气管炎的疗效,为比较西药与中药治疗慢性支气管炎的疗效, 某医师将符合研究标准的某医师将符合研究标准的110110例慢性支气管炎例慢性支气管炎 患者随机分为两组(两组具有可比性),西药患者随机分为两组(两组具有可比性),西药 组组8686例,中药组例,中药组2424例。服药一个疗程后,观察例。服药一个疗程后,观察 患者的

13、疗效,结果见下表。根据显效率,该医患者的疗效,结果见下表。根据显效率,该医 师认为中西药治疗慢性支气管炎的疗效有差别师认为中西药治疗慢性支气管炎的疗效有差别 中药组的疗效好于西药组。中药组的疗效好于西药组。 1. 2检验的基本思想 37 表表10-1 10-1 中西药治疗慢性支气管炎的显效率中西药治疗慢性支气管炎的显效率 【问题10-1】 (1)该资料为何种类型资料? (2)该研究属于何种设计方案? (3)该医师作出的结论是否正确?为什么? (4)该资料应该用何种统计方法?其步骤如何? 38 -22-22表或四格表表或四格表 (fourfold tablefourfold table) 表表1

14、0-1 10-1 中西药治疗慢性支气管炎的显效率中西药治疗慢性支气管炎的显效率 表表10-2 10-2 中西药治疗慢性支气管炎的显效率中西药治疗慢性支气管炎的显效率 39 40 2. 四格表资料的卡方检验 四格表资料 处 理+-合 计 Aaba+b Bcdc+d 合 计a+cb+dn(a+b+c+d) 40 实际频数实际频数A A (actual frequency) (actual frequency) :a a、 b b 、 c c 、 d d =(a+c)/(a+b+c+d)= 53/110=48.18%=(a+c)/(a+b+c+d)= 53/110=48.18% 理论频数理论频数T

15、T (theoretical frequency) (theoretical frequency) : 表表10-2 10-2 中西药治疗慢性支气管炎的显效率中西药治疗慢性支气管炎的显效率 HH 0 0 : : 1 1 = = 2 2 = = , ( (合计率合计率) ) 41 四格表资料 处 理+-合 计 AT11T12nR BT21T22nR 合 计nCnCn(a+b+c+d) 理论频数计算公式理论频数计算公式 42 西药组:理论显效人数 T21=2453/110=11.56 理论非显效人数 T22=2457/110=12.44 中药组:理论显效人数 T11=8653/110=41.44 理论非显效人数 T12=8657/110=44.56 43 基本公式: -反映了A和T吻合的程度; 与格子数有关。 HH 0 0 : : 1 1 = = 2 2 = = , -

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号