临床研究中的常见偏倚 曹素梅概念l当某一研究结果与它的真实值之间出现了某种差异,这种差异的现像及结果称为偏倚l偏倚的本质属于系统误差 偏倚的类型v选择性偏倚v信息偏倚v混杂偏倚选择性偏倚l此种偏倚产生在研究的设计阶段,是在选择研究对象时所出现的系统误差,主要是研究条件受限制或设计研究方案时失误所致入院率偏倚(admission rate bias或称Berkson bias ) 当暴露因素在住院与一般患者中的暴露频率不同时,如果选择入院的患者做研究对像,将歪曲暴露的真实情况 一般人群曾在医院住院6月以上者 骨及运动器官疾病骨及运动器官疾病呼吸道疾病 有无合计有无合计有1720722451520无1842376256018219237 2012583278423234257 RR:1.06 4.06 有无呼吸道疾病时发生骨及运动器官疾病的机会比 l避免入院率偏倚的最好办法就是从一般人群中取样本可疑药物临床疾病比值比(OR)P以社区为基础 以医院为基础水杨酸类过敏1.150.180.02水杨酸类疲乏2.090.720.02缓泻药运动与骨骼系统疾病1.535.070.06缓泻药关节炎类风湿病1.485.000.01两类调查对象估计药物与疾病关联强度的比较两类调查对象估计药物与疾病关联强度的比较现患病例-新病例偏倚(prevalence-incidence bias或Neyman bias) l凡因现患病例与新病例的构成不同,只调查典型病例或者现患病例的暴露状态的改变,致使调查结果出现的系统误差都属于本类偏倚。
某地伴有或不伴有高胆固醇血症与冠心病的关系某地伴有或不伴有高胆固醇血症与冠心病的关系 病例对照研究队列研究 冠心病发病为冠心病血胆固醇水平 有无合计有无合计高38347285462547正常11311723011615111627 15115130220119732174 RR:1.16 RR:2.18l避免现患病例-新病例偏倚的比较好的方法就是开展队列研究 检出征候偏倚(detection signal bias 或unmasking bias)l所谓检出征候偏倚是指当某一因素与某一疾病无因果联系,但因该因素能促使类似该病的症状或体征出现,因而具有该症状或体征的患者急于求医,结果接受检查的机会增多,使其中患该病的病人检出率被人为的提高,导致该因素与疾病的虚假联系的错误结论 以出血疑肿瘤就诊病例刮宫或子宫切除证实病例 子宫内膜癌子宫内膜癌服 用雌 激素 有无合计有无合计有457525942101无7211018289106195 117117234148148296在同一医院的两研究显示绝经期妇女服用雌激素与子宫内膜癌的关系OR:9.8 OR:1.7时间效应偏倚l在病例对照研究中,往往选择症状比较明显的患者作为病例组,而一些未得到确诊的早期或临床前期的患者有可能被选入对照组内,由此产生系统误差 l提高疾病的早期诊断水平,或者开展长时间的前瞻性研究,避免时间效应偏倚。
信息偏倚 无应答偏倚 在任何调查研究中,都存在着一部分研究对象不应答的问题如果应答者与不应答者之间在暴露因素方面存在的差异,将导致研究结果出现系统误差 回忆偏倚l是指被调查者在回忆以往的暴露状态时,记忆失真所造成的偏倚 诱导偏倚l是指调查者为了获得阳性的结论,有意或无意的诱使被调查者作出某一倾向性的回答l为避免诱导偏倚最好采用盲法进行研究志愿者偏倚l来自特殊群体的志愿者,其心理因素与和躯体状况与非志愿者有差别,且对研究的依从性可能优于一般人群,以该类人群的样本作为研究对象所获得的结局会明显不同于非志愿者,由此影响结果的真实性在心肌梗死后的病例中,逐步体力锻炼与复发梗在心肌梗死后的病例中,逐步体力锻炼与复发梗死的队列研究死的队列研究类别有复发无复发合计新近从事体力劳动重75966轻184664合计25105130RR=0.38新近心肌梗死后的病例,耐力训练与复发关系的新近心肌梗死后的病例,耐力训练与复发关系的随机对照研究随机对照研究类别有复发无复发合计随机参加耐力训练是28359387否21345366合计49704753RR=1.26混杂偏倚l在对疾病与某个暴露因素的联系做定量估计时,由于其它因子的影响,使得疾病与暴露因素之间联系的真实性被歪曲。
这种歪曲联系真实性的作用成为混杂作用(confounding effect),如此起到混杂作用的因子成为混杂因子(confounding factor,简称F)偏倚的控制方法偏倚的控制方法设计方案的选择临床随机对照方案是最好的 其次是队列研究的设计方案回顾性的病例对照研究 严格限制纳入标准l严格限制患者的纳入标准,明确研究的范围 盲法测定结果l盲法来衡量与测定结果是避免测量性偏倚的最有效的方法 混混 杂杂 概念 在在对对疾疾病病与与某某个个暴暴露露因因素素的的联联系系做做定定量量估估计计时时,,由由于于其其它它因因子子的的影影响响,,使使得得疾疾病病与与暴暴露露因因素素之之间间联联系系的的真真实实性性被被歪歪曲曲这这种种歪歪曲曲联联系系真真实实性性的的作作用用称称为为混混杂杂作作用用((confounding effect)), ,如如此此起起到到混混杂杂作作用用的的因因子子成成为为混混杂杂因因子子((confounding factor,简称,简称F F) 混杂因素必须具备的条件混杂因素必须具备的条件v混杂因素是一个外部因素混杂因素是一个外部因素v混混杂杂因因素素是是一一个个危危险险因因素素或或通通过过其它危险因素间接作用其它危险因素间接作用v混混杂杂因因素素与与暴暴露露因因素素间间存存在在着着一一定的统计学联系定的统计学联系l饮酒 高血压l 心肌梗塞 冠心病l吸 烟 高血脂l乙肝病毒感染l 肝癌l食黄曲霉毒素的食物.混杂偏倚的性质混杂偏倚的性质l正混杂l负混杂 判断有无混杂偏倚的方法判断有无混杂偏倚的方法根据专业知识提出研究中可能存在的混杂因素 l人口统计学资料 l如年龄、性别、职业、种族、文化水平、如年龄、性别、职业、种族、文化水平、经济收入等经济收入等 l暴露因素以外的其它危险因素的作用利用分层分析法进行判别l所谓分层分析就是按照可疑混杂因素的特征分为若干层,然后逐层进行分析l如果每层的效应值与分层前的效应值不相等。
则这一分层因素为混杂因素 防止混杂偏倚的方法防止混杂偏倚的方法 研究设计阶段v 限制v匹配v分层抽样v单纯随机抽样l限制是指对研究对象的选择条件加以限制,从而排除混杂因素的作用 l为消除混杂因素的干扰,也可将可疑的混杂因素作为匹配的条件来选择各组的研究对象,从而使各组研究对象的特征均衡l群体匹配:指混杂因素在各组间的发生频度大致相同l个体匹配:指按一个或数个混杂因素分层,为每个病例选择同层的对照 l分层抽样是指按照研究对象的特征分为若干层,在每层中进行抽样分层抽样适用于已知的混杂因素非常清楚的情况下l单纯随机抽样l适合于大样本的资料随着每个组的样本数量增加,通过随机抽样,混杂因素在各组间分配得到均衡分析阶段 l分层分析 l按混杂因素分层后,分别就暴露与疾病的联系作分析使用分层分析法,可以评价各层中暴露与疾病的联系,也可以整体估计在分层排除混杂后,暴露与疾病的总体联系 l例:1979年Shadpiro等人调查了234例心肌梗塞(MI)女病人,在入院前一个月使用口服避孕药(OC)的情况,并同时调查了1742名对照,结果如表1表表1 1:近期使用口服避孕药与心肌梗塞的关系:近期使用口服避孕药与心肌梗塞的关系OC使用MI组对照组比值比是29135 否2051607OR=1.68合计2341742 年龄用OCMI组对照组ORRF25-29是4627.24.3 否2224 30-34是9338.95.3 否12390 35-39是4261.50.9 否33330 40-44是693.72.2 否65362 45-49是653.92.3 否63301 合计 2341742 表2:按年龄分组近期口服避孕药与心肌梗塞的关系lOR=[Σ(aidi/ni)]/[Σ(bici/ni)]l =23.71/5.97l =3.97 lVar(InORMH)= Σ(Wi2 Vi)/( ΣWi)2l =2.876/(5.972)2l =0.0806lIn3.97±1.960×0.0806l为0.822-1.935lOR MH95%可信限为:2.28-6.93l标化的方法–先分层,后加权平均l多因素分析法–如logistic回归 谢 谢。