Meta分析和系统评价 (Meta analysis and systematic review),流行病学教研室 钟朝晖,全世界每年 200多万篇 2万余种生物医学杂志 内科医师每天 19篇本专业文献 Sackett的调查 内科医师每周阅读时间<90min; 住院医师以上的高年医师中15%~40%过去一周内未阅读过任何文献——阅读文献综述,叙述性文献综述 文献综述 系统评价,,性质 是由作者根据特定的目的和兴趣,围绕某一题目收集相关的医学文献,采用定性分析的方法,对论文的研究目的、方法、结果、结论和观点等进行分析和评价,结合自己的观点和临床经验进行阐述和评论,总结成文叙述性文献综述(narrative review),基本步骤 确定综述目的 收集相关的原始文献资料 阅读和评价文献 撰写文献综述,叙述性文献综述(narrative review),局限性 综合结果依赖于综述者的主观分析 是对每项研究结果的逐一描述 综合结果时采用定性分析方法(不论文献质量好坏、样本含量大小均一视同仁) 选择文章有倾向性(感兴趣、观点一致) 未对文献质量进行科学评价 不同作者对同一问题的结论可能不一致,叙述性文献综述(narrative review),第一节 系统评价 (systematic review),含义 是近年来发展起来的一种全新的文献综述形式。
指针对某一具体临床问题,全面、系统地收集全世界已发表或未发表的临床研究结果,采用临床流行病学严格评价文献的原则和方法,逐个进行严格评价和分析,筛选出符合质量标准的文献,进行定性或定量合成,得出综合可靠的结论同时,随着新的临床研究的出现进行及时更新,随时提供最新的知识和信息作为决策依据系统评价(systematic review),分类 定性系统评价 原始文献的研究结果被总结但未经统计学合并 定量系统评价(Meta分析) 应用统计学方法对各文献的研究结果进行定量统计合并的过程系统评价(systematic review),表1 叙述性文献综述与系统评价的区别,基本步骤 与一项原始研究过程类似 明确研究目的 、制订系统评价计划书 评价题目主要涉及疾病防治方面不肯定、有争论的重要临床问题 题目确定后,需要制订计划书(题目、背景、目的、收集文献的方法与策略、选择合格文献的标准、评价文献质量的方法、收集和分析数据的方法、结果的分析和报告等 选择文献的依据:需要明确四个要素(研究对象的类型、研究的干预措施或暴露因素、研究的设计方案、主要研究指标),系统评价(systematic review),收集文献 系统、全面地收集所有相关的文献资料是系统评价区别于叙述性文献综述的重要特点。
要按照计划书中的检索策略,采用多渠道检索除发表的文献外,还应收集其他尚未发表的内部资料以及多语种的相关资料 资料来源:①计算机检索;②人工检索;③从临床试验报告论文或综述的参考文献中追踪查阅;④查阅学术会议论文集;⑤请国内外的临床试验资料库提供资料;⑥请药厂提供资料;⑦从其他研究人员处获得资料系统评价(systematic review),选择文献 根据事先制订的纳入标准与排除标准对每一篇文献进行分析与评价,以确定是否能够入选 常用于制订纳入标准的因素(试验设计方案、对照的治疗方法、判断疗效的指标、患者的类别等) 为避免评价者的偏倚,可以进行多人评价系统评价(systematic review),评价文献 对入选的文献,应用临床流行病学/循证医学评价文献质量的原则和方法,进一步进行质量评估这是区别于一般综述的又一重要特点 评价的主要内容: ①文献的真实性 ②影响结果解释的因素(研究因素施加情况) ③结果的实用性,系统评价(systematic review),资料抽提 对按照计划书的要求,从入选的合格文献中摘取需要的数据信息 需要注意: ①如发表的文献中缺乏所需要的数据,可与原作者联系; ②为避免偏倚,可由两人独立按照选择标准进行资料抽提,并进行比较核对。
系统评价(systematic review),分析资料 可采用定性或定量的方法进行分析 灵敏性分析 比较两种不同方法对相同试验进行的系统评价是否会得出不同结果的过程 目的是了解系统评价的结果是否稳定可靠系统评价(systematic review),失安全数 如结果有统计学意义时,为排除发表偏倚的可能,需要多少个阴性试验的结果才能使结论逆转 结论 主要说明:①是否能够得出某一疗法有效或无效的结论,是否可以在临床实践中推广?②如果现有资料尚不足以下结论,那么对今后研究工作的指导价值如何?是否需要进一步进行临床试验?,系统评价(systematic review),第二节 Meta分析 (Meta-analysis),一、Meta分析概念 Meta分析(meta-analysis)又叫荟萃分析,是系统评价的一种,通过综合多个相同目的研究的结果,用定量合成的方法提供一个量化的平均效果或联系强度,从而来回答所研究问题 Meta-分析不是一个简单的统计方法,它是集数据收集和相关信息处理为一体的一系列分析和统计过程它包括提出研究问题、制定纳入排除标准、检索相关文献、汇总基本信息、综合分析并报告结果等系统性研究过程。
Meta-分析最大的优点是通过综合各原始文献的研究结果,增大了研究的样本量,从而增加了研究结果的把握度,并可解决各单项研究结果不一致的问题二、 Meta分析的基本步骤 1、提出问题,确定研究目的 2、检索相关文献 3、选择文献并进行严格评价 4、收集数据 5、对每个研究的特点等情况进行汇总描述 6、确定综合分析效应值的种类及统计分析计划 7、描述纳入研究的结果及其特征 8、异质性检验(heterogeneity test) 9、计算合并效应量 10、敏感性分析,三、Meta-分析的异质性检验 针对相同问题进行的多项单个研究,其研究结果间肯定存在差异,这种差异的来源为两方面: ①抽样误差; ②研究间存在异质性:设计类型、试验条件、测量方法等方面不同导致研究结果的不一致 进行异质性检验的目的就是要确定“差异”的原因一)异质性检验的方法 1、Q统计量检验法 (1)建立无效假设 H0:θ1=θ2=θ3=……=θk(即纳入研究的效应量均相同) (2)计算统计量Q值,式中: Wi为第i个研究的权重值; Ti为第i个研究的效应量; 为所有研究的平均效应量;,(3) Q服从于自由度为df = k – 1的χ2分布,根据df查表求得 P值。
若 P0.05则接受 H0;若P0.05则接受 H1 Q检验法的检验效能较低当纳入研究的数目较少时,Q检验出现假阴性错误的机会较大;当纳入研究的数目过多,则可能出现假阳性错误,使本不具异质性的资料出现Q检验P0.05的结果所以,利用Q检验时下结论应该慎重二)异质性的来源 如果通过分析各研究间确实存在异质性,则应进一步考虑产生异质性的原因 引起异质性的原因很多,归结起来主要与研究设计和实施方法不统一有关例如: 1、设计质量上的差异; 2、干预措施施加方法的差异; 3、测定结局的方法与时间不统一; 4、研究对象纳入、排除标准有差异; 5、统计模式或分析方法上的差异三)异质性的处理 1、进行亚组分析 根据导致异质性的主要矛盾,将纳入分析的所有研究分为不同亚组,然后对各亚组结果进行分析、讨论,探讨有关因素对总效应值影响的有无及程度 2、进行敏感性分析 将严重影响异质性的异常项排除,然后重新进行Meta-分析,并将结果与排除前进行比较,探讨该异常项对总效应的影响及程度 3、利用随机效应模型估计合并效应量的分析 当异质性不明显时,采用随机效应模型估计合并效应量,结果较可靠 4、采用Meta回归及混合效应模型进行效应量的分析 这样可有效控制混杂因素的影响,得到多种因素共同作用下的合并效应量。
5、放弃Meta-分析 当资料异质性过大,则应放弃Meta-分析,改为对资料做描述性评价四、Meta-分析中资料的统计分析 根据所收集的资料异质性的大小、效应量的性质、种类等不同,所采用的统计分析方法也不同 Meta-分析计算合并效应量的主要方法有: 固定效应模型 随机效应模型 Meta-回归模型 混合效应模型,(一)固定效应模型 (fixed effects model) 应用条件 应用该模型的前提是假设各项研究无异质性,其间效应量的差别是由于抽样误差所致 该模型的主要统计分析方法有: Peto法 Mantel-Haenszel法 方差倒数权重法 对连续变量的统计法,,1、Peto法及其计算过程 (1)编制计算过程表及整理四格表资料,实例分析:为评价阿司匹林治疗心肌梗死的疗效,收集了5个多中心临床试验研究的资料,见下表: 表2 5个随机试验研究的结果,表3 Peto 法计算过程及结果,则Q=10.79-[(_37.78)2/140.48]=0.63,v=5-1=4,p0.05,异质性检验无统计学意义,说明研究间效应量是同质的表3 Mantel-Haenszel 法计算过程,ORMH=0.76,95%可信区间为(0.67,0.86); 异质性检验结果Q=0.63,p0.05,无统计学意义。
Peto法是M-H法的改良方法它的特点(与M-H 法比较): (1)解决了有时M-H卡方与ORMH结果不一致的问题; (2)主要用于固定效应中OR值的估计; (3)表达上较M-H法简洁,但对于观察性研究 Peto法的统计效能较M-H法低; (4)系统评价数据库软件(RevMan)进行Meta分析时推荐采用Peto法 方差倒数权重法,其实质与M-H法一样(略)3、对连续变量的统计分析 (1)计算各研究的标准均数差值di 相当于试验组(t)与对照组(c)均数差值的标化处理过程实例:某研究者为了分析某降血脂药物的疗效,纳入分析了5个临床随机对照研究,具体结果如下表:,合并标准化均数差值为0.355,其95%可信区间为(0.095,0.615); 异质性检验Q=3.96,p0.05,无统计学意义二)随机效应模型(random effect model) 1、分类变量的随机效应模型(D-L法) 该统计方法又叫“Der Simionian and Laird方法”,简称D-L法 该方法的特点是允许有一定程度的异质性,因为它考虑进了各研究间可能存在的变异在计算各研究的权重时,同时纳入了组内变异(组内方差)与组间变异(组间方差),它适用于各研究效应值存在异质性的资料。
利用该方法进行分析时,一般要求收集9篇以上的研究结果,才能得到较稳定的结果 具体计算过程:,表4 四格表资料的计算过程,表5 黑素瘤与日照关系的7个病例对照研究的meta分析,表6 黑素瘤与日照关系的7个病例对照研究的随机效应模型,注意: 当异质性不明显时,Peto与D-L两种方法的结果类似; 若异质性明显时,则应选择D-L法2、计量资料的随机效应模型,合并标准化均数差值为0.368,其95%的可信区间为0.133,0.603三)Meta回归及混合效应模型 1. Meta回归模型 当研究者能准确地收集并测量所有影响合成效应的异质性来源时,可用回归模型去排除这些变异因素的影响,从而估计到校正合并效应量β0+ β1Xi1 +...+βpXip+,Ti=,ei,其中Xi1 ...Xip为影响变异的混杂因素, β0为常数项, β1.. βp为偏回归系数 如果能完全控制异质性来源,则β1….βp=0,回归模型就等于固定效应模型WMD:加权均数差值,五、Meta-分析的结果评价 1、统计分析是否包括了与题目相关的所有文献数据 2、纳入研究的数据质量如何,是否完整? 3、发表性偏倚是否存在,并影响了统计分析结果 4、是否报告了异质性检验结果 5、统计分析方法的选用是否合适 6、合并效应量有无统计学意义,临床意义及外部真实性如何,,,纳入研究质量评价 (1)设计方案的评价。