统计方法在循证医学中的应用

上传人:飞*** 文档编号:52115492 上传时间:2018-08-18 格式:PPT 页数:42 大小:557.50KB
返回 下载 相关 举报
统计方法在循证医学中的应用_第1页
第1页 / 共42页
统计方法在循证医学中的应用_第2页
第2页 / 共42页
统计方法在循证医学中的应用_第3页
第3页 / 共42页
统计方法在循证医学中的应用_第4页
第4页 / 共42页
统计方法在循证医学中的应用_第5页
第5页 / 共42页
点击查看更多>>
资源描述

《统计方法在循证医学中的应用》由会员分享,可在线阅读,更多相关《统计方法在循证医学中的应用(42页珍藏版)》请在金锄头文库上搜索。

1、统计方法在循证医学中的应用广州医学院统计学系用当前最佳临床证据指导临床决策与实践 是循证医学的核心内容,而许多最佳临床医学 证据中包含了大量医学统计学知识,正确理解 和应用循证医学相关统计学知识,对循证医学 研究者和应用者都十分重要。系统评价被公认的最佳临床医学最佳证据之一,其中的医学统计学内容主要包括统计描述和统计推断两大类。统计描述利用统计指标,统计图和统计表,反映数据资料基本特征。系统评价中的统计描述指标,计数资料主要有相对危险度(relative risk, RR);比值比(odds ratio,OR),率差(rate difference, RD)计量资料除均数和标准差外,还有均数差

2、(mean difference,MD)和标准化均数差(standardised mean difference, SMD)统计推断利用样本提供信息对总体进行估计或推 断,主要包括参数估计和假设检验。参数估计 是利用样本指标估计总体参数,常用置信区间 方法估计,如率的置信区间。假设检验如t检 验和卡方检验。RR,OR,MD的置信区间和Meta分 析。循证医学常用统计指标及置信区间频率型指标:最常见,近似地反映某一事 件出现的机会大小, 如发病率、死亡率等。二分类结果?吸烟与不吸烟,痛与不痛,死亡与生存,等等每位观察对象处于两种互相排斥的状态之一。机遇的表达方式危险度(risks)和机会(odd

3、s)是将机遇数据 化表达的方式对于二分类事件,危险度和机会是表达两种 状态中的一种发生的机遇危险度(Risk)24个人滑雪,6个人摔倒 则滑倒的危险度=6个摔倒的人/24个滑雪人=6/24=0.25=25%Risk=关注事件的数量/观察对象的总数机会(odds)24个人滑雪,6个人滑倒滑倒的机会=6个滑倒的人/18个没有滑倒的人=0.33(不采用百分比%) Odds=关注事件的数量/观察对象的总数-关注 事件的数量用语言描述:危险度滑倒的机遇是四分之一,即25%机会滑倒的机遇是未滑倒人数的三分之一每滑倒一个就有三个不滑倒滑倒的机遇是一对三危险度和机会相差多大?某研究对照组的164个患者中有13

4、0个无效 ,则无效的机遇:危险度(Risk)=130/164=0.79;机会(Odds)=130/34=3.82另一研究对照组的63个患者中有4个无效, 则无效的机遇:Risk=4/63=0.063Odds=4/59=0.068组间比较四格表有病痊愈合计治疗组11945164对照组13034164合计24979328Risk ratio (relative risk)治疗组的事件危险度 Experimental event rateEER=119/164=0.726有病痊愈合计治疗组11945164 对照组13034164 合计24979328n对照组的事件危险度 Control event

5、rateCER=130/164=0.793nRisk ratio=0.726/0.793=0.92RR=Risk on treatment Risk on controlOdds ratio治疗组的事件机会=119/45=2.64有病痊愈合计治疗组11945164对照组13034164 合计24979328 n对照组的事件机会=130/34=3.82nOdds ratio=2.64/3.82=0.69OR=Odds on treatment Odds on controlExpressing RR and ORRR 0.92:治疗组中发生事件的危险性是对照组中发生 事件的危险性的92%;治疗使

6、发生事件的危险性减少到约90%;治疗减少了8%的发生事件的危险性。OR 0.69:治疗使发生事件的机会减少到约70%;治疗减少了30%的发生事件的机会。(Absolute) Risk reduction, (A)RRRisk on control risk on treatmentFor the example before:=0.7930.726=0.067Usually expressed as a %, so:6.7%治疗减少发生事件的危险性约7个百分点Number need to treat, NNTIf treatment one patient reduces the risk o

7、f still being dyspeptic by 0.067, we help 0.067 of a person How many do we expect to treat before a whole person would be helped? 0.067what=1 What=10.067=about 15Its means that we would need to treat 15 people (forweeks) to cure one extra person of dyspepsiaNNT=1/ARR区间估计总体参数的置信区间(confidence interval

8、 , CI) 置信水平:1 一般取0.05或0.01,故1 为0.95或0.99当我们据一份样本对总体均数只作一次区间估计 时,我们宣布 “总体均数 在范围内”- 这句话未必正确,可信的程度为95%!1. 正态近似法:当n足够大50,若 n p 5 和n (1-p) 5,则总体率 (1- ) 可信区间为:总体率95%可信区间为 p 1.96 sp总体率99%可信区间为 p 2.58 sp p p u u s sp p= p - u = p - u s sp p p + u p + u s sp p总体率的区间估计总体率的区间估计例:某地中学生就餐方式与乙肝病毒感染情况调查就餐方式 调查人数 感

9、染人数 感染率(%) 常在外就餐(A) 89 6 6.74 不在外就餐(B) 111 5 4.50合计 200 11 5.50抽样误差:抽样误差:0.0266 =2.66%0.0674(1 - 0.0674 )Sp = 89(A):(B):0.0450 (1 - 0.0450 )Sp = 1110.0197 =1.97%p(1 p)Sp = n例: 某地中学生就餐方式与乙肝病毒感染情况调查就餐方式 调查人数 感染人数 感染率(%) 标准误 常在外就餐(A) 89 6 6.74 2.66% 不在外就餐(B) 111 5 4.50 1.97%总体率95%可信区间为 p 1.96 sp总体率99%可

10、信区间为 p 2.58 sp 总体感染率95%可信区间:(A): 6.74% 1.962.66% = 1.53% 11.95%(B): 4.50% 1.961.97% = 0.64% 8.36%2.率差及置信区间两个发生率的差即为率差(rate differnence, RD), 大小反映实验效应大小,置信区间反映用于推断两个 率有无差别。两率差为0时,两组发生率无差别。两 率差的置信区间不包含0(上下限均大于0或均小于 0),则两个率有差别;反之两率差置信区间包含0, 无统计学意义。 两率差的置信区间两率差的标准误OR及置信区间二、数值资料的指标1. 算术均数 简称均数(mean,),适合描

11、述对称分布资料的集 中位置(也称为平均水平)。其计算公式为n:样本含量X1,X2,Xn:观察值或 :观察值之和例2-3 测得8只正常大鼠血清总酸性磷酸酶(TACP)含 量(U/L)为4.20,6.43,2.08,3.45,2.26,4.04,5.42 ,3.38。试求其算术均数。按式(2-1),算术均数为 2. 几何均数(geometric mean,G)适用于观察值变化范围跨越多个数量级的资料 频数图一般呈正偏峰分布例2-5 7名慢性迁延性肝炎患者的HBsAg滴度资料 为1:16,1:32,1:32,1:64, 1:64,1:128,1:512。试 计算其几何均数。3. 中位数(median

12、,M)可用于各种分布的定量资料总体中有一半个体的数值低于这个数,一半个体的数 值高于这个数。基于样本资料 将n例数据按升序排列,第i个数据记为n为奇数时n为偶数时 例2-7 某药厂观察9只小鼠口服高山红景天醇提取物 (RSAE)后在乏氧条件下的生存时间(分钟)如下: 49.1,60.8,63.3,63.6,63.6,65.6,65.8,68.6 ,69.0。试求其中位数。二、描述离散趋势的特征数同一总体中不同个体之间的离散趋势又称为变异( variation)。例2-11 试观察三组数据的离散状况。(均数都是30 ) A组:26,28,30,32,34 B组:24,27,30,33,36 C组

13、:26,29,30,31,34 1. 极差(range,R)R = 最大值最小值 计算简便,但仅利用了两个数据的信息 一般,样本量n越大R也往往会越大, 不够稳定例2-12 计算上述三组数据的极差 A组 R=34-26=8 B组 R=36-24=12 C组 R=34-26=82. 四分位数间距(quartile range,Q)Q= P75-P25P25与P75之间恰好包含50%的个体四分位数间距Q是总体中数值居中的50%个体散布的范围Q越大意味着数据间变异越大3.方差(variance) 又称均方差(mean square deviation):总体均数 N:总体中个体的总数 分母:离均差平

14、方和 方差越大意味着数据间变异越大 样本方差:或n-1称为自由度(degrees of freedom): 总体方差:4. 标准差(standard deviation,S)标准差是方差的算术平方根。 标准差的量纲与原变量一致。 标准差越大意味着个体间变异越大。 标准差适合用来表达对称分布的离散趋势。例2-14 分别计算例2-11中三组数据的标准差。按照公式(2-11)与标准差的定义A组 B组 C组 C组数据的离散趋势最小,B组的最大5.变异系数(coefficient of variation , CV) 例2-16 1985年通过十省调查得知,农村刚满周 岁的女童体重均数为8.42kg,标

15、准差为0.98kg ; 身高均数为72.4cm,标准差为3.0cm。体重的 变 异大还是身高的变异大? 体重的变异系数身高的变异系数 用于 量纲不同的变量间变异程度的比较或 均数差别较大的变量间变异程度的比较二、置信区间的计算若将置信度定为(1- ),则总体均数 的(1- ) 置信区间的一般计算式为或缩写为 例5-3 已知例5-1中某地27名健康成年男子的 血红蛋白量均数=125 g /L,标准差S = 15 g /L 。试问该地健康成年男子血红蛋白平均含量的 95%置信区间和99%置信区间各是多少?n =27, = 27 1=26 双侧 t0.05/2, 26=2.056, t0.01/2, 26= 2.779 95%置信区间:99%置信区间: 2. 正态分布方

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号