计数资料的统计描述与卡方检验

上传人:豆浆 文档编号:54153960 上传时间:2018-09-08 格式:PPT 页数:82 大小:639KB
返回 下载 相关 举报
计数资料的统计描述与卡方检验_第1页
第1页 / 共82页
计数资料的统计描述与卡方检验_第2页
第2页 / 共82页
计数资料的统计描述与卡方检验_第3页
第3页 / 共82页
计数资料的统计描述与卡方检验_第4页
第4页 / 共82页
计数资料的统计描述与卡方检验_第5页
第5页 / 共82页
点击查看更多>>
资源描述

《计数资料的统计描述与卡方检验》由会员分享,可在线阅读,更多相关《计数资料的统计描述与卡方检验(82页珍藏版)》请在金锄头文库上搜索。

1、计数资料的统计描述与卡方检验,四川大学华西医院 康德英,临床研究中计数资料来源、分类,本身设置为分类变量(PI/ECOT) 从计量资料转化而来:,如评价降压疗效时,将舒张压降低值分为三类: 5mmHg 无效 5-10mmHg 有效 10-20mmHg 显效 Note:计量资料转化为计数资料,过程本身损失信息,应慎重。,计数资料的分类,无序分类: 二项或二分类:对立、不相容的两类。 如疗效:病死与未愈,感染与否等。 多项或多分类:互不相容的多类。 如感染部位、感染分型等 有序分类:类间不相容且有程度差别。 如疗效:痊愈、显效、好转、无效。,特点:无度量衡单位;定性测量,在赋值时应考虑类型而定。

2、* 二分类变量: 0,1 * 有序多分类:多采用等间距赋值 如 -、+、+、+(0、1、2、3) * 少量非线性关系有序多分类赋值:考虑哑变量 * 无序多分类变量赋值: A、B、AB、O 1 2 3 4?,计数资料的分类赋值,采用哑变量方法:dummy variable,革阳菌的哑变量赋值为(1,0,0),革阴菌哑变量赋值为(0,1,0),真菌哑变量赋值为(0,0,1),一、计数资料的统计描述方法,(一)图表: 频数表,直条图,饼图,变量类型的判断,1、频数表,9名感染病例的职业状况,部分原始数据,2、直条图,直条图(bar 条形图):分类变量资料的频数图, 条与条间独立,顺序可不固定。与Hi

3、stgram不同,饼图/圆饼图/圆图/pie图,百分条图 (percent bar),(二)率、比 (构成比、相对比),1、率 (rate, frequency),率又包括频率指标(frequency)和强度指标(rate),用来测量一定时期内,某人群特定事件发生的频率或强度。 率=(发生某现象的观察单位数)/(某时间段可能发生某现象的观察单位数) 常用百分率(感染率)、千分率、10万分率(肿瘤发病率)表示。,率是一个动态指标,在观察期内看特定人群中某事件的变化。 率有时间单位观察时间影响率的大小。,与医院感染有关的率,医院感染发生率 医院感染罹患率 医院感染患病率(即现患率),医院感染发生率

4、,是指一定时间内某人群中新发病例的频率。 公式=(同一时期内新发生医院感染例数/同一时期内处于危险中病人数)100% 或公式=(同期新发生医院感染例数/同期住院病人人数或出院病人数)100%,观察时间可为年、季、月,一般为年。 年发病率/月发病率/季发病率,医院感染罹患率(同发生率),公式:(同期新发生医院感染例数/观察期间具感染危险的住院病人数)100%,计算医院感染率时,分子确定要注意: 病例的感染时间要“落入”观察期内,即必须是新病例。 注意病例与病人的区别。 感染必须确诊,分母:可能发生感染的人数,其范围界定很关键,暴露人群又称危险人群,指发生感染的可能人群 应排除那些已感染或因年龄、

5、免疫等因素而不会感染的病人?,现患率,也称患病率或流行率,指某特定时间某人群中感染人数所占比重或比例。 公式=(特定时间存在的医院感染例数/观察期间处于感染危险中的病人数)100% 现患率主要在基线调查研究中使用,一般用调查病人数作为分母。也用于评价感控效果。,计算现患率时应注意: 分子包括新、老感染病人,只要调查时正处于感染状态,均计算在内。 分母调查人数,可分为时点现患率与期间现患率 point prevalence period prevalence 调查时应尽量缩短调查时间 cross-sectional study /Cohort study,2、构成比 (proportion),说

6、明某一事物内部各组成部分所占的比重和分布,常用百分数表示(0%-100%)。,构成比是一特定时间(time point)某特定事件在总体事件数中所占的比重。 proportion=a/(a + b + c+) 是一个静态指标 无时间单位,3、相对比 (ratio),相对比是A、B两个指标之比,是比较两独立事件数量大小关系指标(独立指互不包含):比=A/B 两个指标可性质相同,可不同;绝对数、相对数或平均数。 是一个静态指标,反映一特定时间(time point)的情况。 无时间单位,例1 某医院院内感染汇总分析,月份 出院人数 感染人数 感染率 构成比 相对比 1月份 584 8 1.37 8

7、.8 - 2月份 571 10 1.75 11.0 1.28 3月份 714 12 1.68 13.2 1.23 4月份 748 16 2.14 17.6 1.56 5月份 942 21 2.23 23.0 1.63 6月份 1095 24 2.19 26.4 1.60 合计 91,计数资料的统计描述:率与比的综合应用,(三)、计数资料统计描述的 注意事项,计算率时要求分母不宜过小。少于10例则直接描述。,例2 血清TPS检出率与消化道肿瘤淋巴结转移关系,分析时不能以构成比代率 例3 某作者调查医院感染病例,获得如下数据:,结论:说明60岁年龄组最容易发生感染。,(四)、率的标准化,例4 甲、

8、乙两个医院感染率比较 病情程度 甲医院 乙医院 例数 感染数 感染率 例数 感染数 感染率 重 800 160 20% 100 30 30% 中 200 20 10% 400 60 15% 轻 100 5 5% 1000 100 10% 合计 1100 185 16.8% 1500 190 12.7%,1、标准化法的基本方法,方法1:采用标准人口构成与原始分组率,计算标准化率,直接比较。 方法2:采用分组标准化率与原始人口,计算标准化比,间接比较。,1)、直接法-标准人口,病情程度 甲医院 乙医院 例数 感染数 感染率 例数 感染数 感染率 重 800 160 20% 800 240 30%

9、中 200 20 10% 200 30 15% 轻 100 5 5% 100 10 10% 合计 1100 185 16.8% 1100 280 12.7% 25.4%,2)、间接法:分组标准率,病情程度 甲医院 乙医院 例数 感染数 感染率 例数 实际 预期 感染数 感染数 重 800 160 20% 100 30 20 中 200 20 10% 400 60 40 轻 100 5 5% 1000 100 50 合计 1100 185 16.8% 1600 220 110 计算标准化感染比(SIR)=(实际感染数与预期感染数比)=220/110=2;SIR1, 表示被标化组的感染率高于标准组

10、。,2、标准化率的注意事项,条件:比较双方应同质、同时、同地,比较的两组应选用同一标准。 标准选用不同,标化率可不同。标准化率只是两组的相对水平,不反映实际的情况,只能用于比较。 总体标准化率比较也需进行假设检验。,(五)以率/比基础的二级指标,相对危险度(RR) 比数比(OR) 绝对危险度(AR) NNT,用来表达危险度的大小或关联程度,OR、RR,OR(比数比)、RR(相对危险度) 适用条件: 对于RCT试验:可以计算OR、RR 对于病例对照研究:只能计算OR,1、相对危险度(率比),组别 感染 未感染 合计 感染率 治疗组 a b a+b Pe 对照组 c d c+d Pc 合计 a+c

11、 b+d a+b+c+d RR(相对危险度)为治疗组与对照组的感染率之比。RR=Pe/Pc,实例(例5)分析,组别 未感染 感染 合计 感染率 治疗组 90 10 100 0.1 对照组 80 20 100 0.2 某种抗生素预防院内感染的疗效分析。,RR计算的实例演示,治疗组发生感染的危险度(率)=10/100=0.10 对照组发生感染的危险度(率)=20/100=0.20 相对危险度(RR)=0.5,2、比数比(OR),组别 暴露 非暴露 合计 暴露/非暴露比 病例组 a b a+b a/b 对照组 c d c+d c/d 合计 a+c b+d a+b+c+d OR(比数比)为病例组暴露与

12、非暴露的比例与对照组暴露与非暴露的比例之比;OR=ad/bc,OR计算的实例演示,比数比又常称为机会比/优势比/比值比。,组别 未感染 感染 合计 感染率 治疗组 90 10 100 0.1 对照组 80 20 100 0.2 某种抗生素预防院内感染的疗效分析 本例OR=0.44。,OR、RR临床(实际)意义,OR、RR1,表明暴露因素为危险因素,偏离1越远,表示危险性越强 0OR、RR1,表明暴露因素为保护因素,离0越近,表示保护性越强 OR、RR=1,表明暴露因素与结果无关,注意:暴露因素和结果的赋值标准化:1表示暴露,0表示未暴露;1表示感染,0表示未感染。否则结论可能刚好相反。,相对危

13、险度与比数比的关系,例6:治疗组感染率=10/100=0.1;对照组感染率0.2 RR=0.5 OR=0.44 例7:治疗组感染率=5/100=0.05;对照组感染率=10/100=0.1 RR=0.5 OR=0.48 当率较低,如小于10%时, RR值与OR值近似相等。率值越小(罕发事件),越接近。 对大规模临床随机对照试验:OR、RR可使用。,3、绝对危险度(率差),对照组感染率40%,试验组20%,RR=0.5? 对照组感染率10%,试验组5%,RR=0.5? AR为两个率的绝对差值:即对照组率-治疗组率,绝对危险度实例计算,对于感染率研究: 绝对危险度为:20%-10%=0.1 (常用

14、百分数表示:10%) 治疗能使感染率的危险度减少10%左右,4、NNT,NNT(Numbers Needed to Treat):为避免一例不良事件发生而需要治疗的病例数.其值为绝对危险度的倒数(1/AR) 类似还有:NNH(Numbers Needed to Harm)。,NNT实例演示,如果治疗一个病人能减少感染的0.10危险度,即我们能挽救0.1个人。 那么为挽救一个完整的人,需要治疗多少病人?NNT=1/0.110 需要治疗10个病人,才能比对照组多减少1个感染病例。,计数资料统计描述小结,率与比可用来描述某事件发生机会的大小。 二分类变量资料描述 相对危险度(RR)与比数比(OR)是

15、用来描述两组间事件发生的机会之比。 当事件的发生机会较大时,RR与OR相差较大;当为罕发事件时, RR OR。 绝对危险度是指率差,NNT为避免一例不良事件发生而需要治疗的病例数。,二、计数资料的假设检验 - 卡方检验- Pearson Chi-square test,KarlPearson,18571936,生卒于伦敦,公认为统计学之父。 1879年毕业于剑桥大学数学系;曾参与激进的政治活动,还出版几本文学作品,并且作了三年的实习律师。1884年进入伦敦大学学院 ,教授数学与力学,从此在该校工作一直到1933年。 K Pearson 最重要的学术成就,是为现代统计学打下了坚实基础。KPearson 在1893-1912年间写出18篇在进化论上的数学贡献的文章,而这门“算术”,也就是今日的统计。许多统计名词如标准差,成分分析,卡方检验(1900)都是他提出。,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号