《流行病学研究中的常见偏倚幻灯片资料》由会员分享,可在线阅读,更多相关《流行病学研究中的常见偏倚幻灯片资料(80页珍藏版)》请在金锄头文库上搜索。
1、流行病学研究中的常见偏倚及其控制,上海交通大学公共卫生学院施榕,偏倚(bias)指观察值与真值之间的偏离,是一种随机误差以外误差的误差,属系统误差(systemicerror)它是由某些较为恒定的不能准确测量的因素所造成。偏倚可发生在流行病学研究的设计、实施分析等各个阶段,如选择对象中以志愿者代替随机样本,使调查对象不能代表总体。重复抽样或加大样本含量并不能使这种误差减少或消失。流行病学研究中常见的偏倚主要有三大类,即选择偏倚、信息偏倚、混杂偏倚。,第一节选择偏倚及控制,一、选择偏倚概念及类型选择偏倚(selectionbias)是由于选择研究对象的方法有问题,使入选者与未入选者在某些特征上存
2、在着系统差异,从而导致研究结果偏离真实情况。在各类流行病学研究中均可发生选择偏倚,以病例对照研究中较为常见,如入院率偏倚、现患病例-新病例偏倚、检出症候群偏倚等。,1.入院率偏倚(admissionratebias),入院率偏倚是由于各种疾病的入院率不同而致的偏倚。现举例说明。某研究者计划研究A病与X因素的关系,A病例取自某医院,同时,他以同一医院随机抽取相应人数的B病人作对照。,假设A病住院率为25,B病住院率为60,具有X因素也有一定的入院率为40。现就上述不同的入院率计算住院人数:A病无X因素住院人数48000.251200人A病有X因素住院人数12000.25(1200300)0.46
3、60人B病无X因素住院人数48000.62800人B病有X因素住院人数12000.6(1200720)0.4912人,表6-2医院为基础的病例对照研究,P0.01,,上述结果表明人群中A病与X因素本无关联,而以医院病例作为样本所得观察结果则是有关联的。,2.现患病例-新病例偏倚(prevalence-incidencebias),在病例对照研究,调查时选择的病例往往是存活的现患病例,无法对那些因患病已死亡的病例或轻型、非典型或已痊愈的病例进行调查,而队列研究中常采用新发生的病例,因而病例对照研究得出的结论与队列研究的结果可能发生差异,此即现患病例-新病例偏倚,也称为奈曼偏倚(Neymanbia
4、s)。,例如,Friedman等人在美国弗明汉地区对心血管系统疾病的研究中发现:男性居民在队列研究中,具有高胆固醇水平者,患冠心病的RR值为2.40,而另一项病例对照研究中,病例组与对照组却无明显差异,OR=1.16(表)。,表6-3费明汉地区男性居民血胆固醇水平与冠心病关系,进一步调查发现,患冠心病病人在被诊断为该病后,其后来的生活习惯或嗜好发生改变,如开始戒烟、多食低胆固醇食物、进行体育锻炼,从而使血中胆固醇水平降低,因此病例对照研究的结论存在明显的差异。,3.检出征候群偏倚(detectionsignalbias),检出征候群偏倚是指某因素与某疾病在病因学上虽无关系,但由于该因素的存在会
5、引起该病的临床症状或体征的出现,从而使患者及早就医,接受多种检查,导致该人群有较高的检出率,致使过高地估计该因素与该疾病的关联。,例如,1975年,Ziel等以病例对照研究,从美国加州洛杉矶妇女中调查口服雌激素与子宫内膜癌的关系,结果表明子宫内膜癌患者雌激素暴露比例明显高于对照组,认为子宫内膜癌与服用雌激素密切相关。,表6-4更年期服用雌激素与子宫内膜癌的关系,1978年,Horwitz指出,这一结论是由检出征候偏倚所致,两者之间的高度关联是虚假的。因为在人群中有一定量的无症状的子宫内膜癌早期病人,她们若不服用雌激素,子宫不致出血,因而不去医院就诊,而不能被发现。,4.志愿者偏倚(volunt
6、eerbias),一般情况下,志愿者与非志愿者在关心健康、注意饮食习惯、禁烟、禁酒及体育锻炼等方面可能存在系统的差别,因而,志愿者被入选为观察对象,而非志愿者落选,这样的研究结果往往有选择偏倚。例如,一项以体育锻炼预防冠心病的研究,干预组都是志愿者,而将非志愿者作对照,以比较该项措施的效果,这样就可能会得出不正确的结论。,从上例可以看出选好对照组是十分不容易的,它同研究者的临床知识,经验,及关于研究变量的特征,对象选入的方法等都有关。有时还需将多种对照同时观察更能说明问题。,5.无应答偏倚(nonrespondentbias),无应答者是指研究对象中未按设计要求对被调查的内容予以应答者。某个特
7、定样本中的无应答者的患病情况及某些因素的暴露情况与应答者可能不同,因此而产生的偏倚称为无应答偏倚。此种偏倚在分析性研究和实验性研究中均可发生。,如Seltze等报道,以函访调查人群吸烟状况时发现,85%的非吸烟者在一个月内回函应答了调查内容,但在吸烟者中,应答率仅占67%,这样对男性吸烟的估计是明显低估的。,6.失访偏倚(losstofollowupbias),失访也是无应答的一种表现,只是它主要发生在队列及实验性研究中。在随访研究过程中,研究对象未能按计划被随访,它是此类研究选择偏倚的主要原因之一。,失访一般有两种情况,一种是由于观察期限短于原规定的观察危险期,一般与所观察的暴露因素或结果无
8、关,且经过统计学处理能把他们当作截尾数据(censoreddata)处理。虽观察不到他们发生某事件的概率,但与留在观察组中的非失访者是相同的,一般较少引起偏倚。,另一种失访是在随访过程中因种种原因拒绝继续留在观察组中,他们的失访是主动的,多半同所研究的暴露因素或结果有关。若数量不大,不致引起偏倚,但若数量较大,则有可能产生偏倚。一项研究的失访率最好不超过10或稍高,否则应慎重考虑对结果的解释。,二、选择偏倚的测量与防制,(一)、选择偏倚的测量,选择偏倚在理论上可以通过总人群与实际抽样人群疾病与暴露分布情况进行测量。下面以病例对照研究为例,总人群与实际抽样人群中疾病与暴露因素的分布分别如表6-5
9、和表6-6所示:,表6-6实际抽样人群疾病与暴露分布,表6-5总人群疾病与暴露分布,总人群比数比:,样本比数比:,选择概率为:,根据选择概率:,选择偏倚,或,若偏倚=0即,=1,则不存在选择偏倚,偏倚0,即,1,则存在正向选择偏倚,偏倚0,即,1,则存在负向选择偏倚,现以前述入院率偏倚为例,=660/1200=0.55=1200/4800=0.25=912/1200=0.76=2880/4800=0.6,偏倚=,-1=0.74,(二)选择偏倚的防制,1、正确的研究设计首先研究者对整个研究可能会产生的各种选择偏倚有充分的了解。在设计中,应注意使被比较的各组有同等的概率受到调查。应考虑可能出现的各
10、种偏倚,以及会在那些环节出现,只有在设计时考虑周全,并采取相应措施,在各个环节中阻断偏倚产生的可能性,才能防止或减少其发生。,2、尽量采用多种对照理想的是以人群中全体病例和非病例(或其有代表性的样本)作为研究对象。如以医院病例为研究对象,宜在多个医院选择对象,且最好有2个对照组,其中一个对照组来自社区一般人群,在队列研究中,最好也应设多种对照,以减少选择偏倚对结果的影响。,3、严格掌握研究对象入选与排除的标准使研究对象能较好地代表其相应的总体。如病例对照,一般可规定病例的入选原则为新发的确诊病例,以避免Neyman偏倚。在实验性研究中,应严格按照随机分配的原则,将研究对象分组,使两组除所观察因
11、素外应具有均衡性、可比性。应避免将志愿者分为一组,非志愿者分为另一组,病情轻者分在一组,病情重者分在另一组等情况的发生。,4、提高研究对象的依从性在研究中应采取相应措施,尽量取得研究对象的合作,尽可能提高应答率,减少无应答率和队列研究中的主动失访,要做好组织、宣传工作,调查手段要简便易行,对调查中的问题应采取适当的处理技巧。若无应答或失访者超过10%,应对无应答者或失访者进行随机抽样调查,对失访者和已随访者的特征做比较分析。对研究结果可能有影响有关数据与应答者进行分析比较,若两者差异有显著性,说明对结果有影响,在结论中应加以说明并应作慎重的分析。,第二节信息偏倚及控制,一、信息偏倚的概念及类型
12、信息偏倚(informationbias)是指在研究的实施阶段中从研究对象获取研究所需的信息时产生的系统误差,其原因是由于诊断疾病、测量暴露或结局的方法有问题,导致被比较各组间收集的信息有差异而引入的误差。各种类型的流行病学研究中均可产生信息偏倚,病例对照研究中常见的信息偏倚有回忆偏倚、报告偏倚、调查者偏倚、诱导偏倚等。错误分类偏倚则在病例对照研究和队列研究中都可产生。,1回忆偏倚(recallbias),指比较组间在回忆过去的暴露或既往史时,其完整性与准确性存在系统误差而引起的偏倚。回忆偏倚在病例对照研究中最常见,主要原因有:(1)研究对象对调查的内容关心程度不同,一般情况下,病例组患者对调
13、查的事件回忆认真程度高于对照人群,因而导致两组对象在回忆以往事件的准确性存在差异。(2)调查的事件或因素发生的频率较低,未给研究对象留下深刻印象而遗忘。(3)调查事件是很久以前发生的事情,研究对象记忆不清。,2报告偏倚(reportingbias),被调查者有意隐瞒真实情况,夸大或缩小某些信息而导致研究结果产生偏倚,故亦称说谎偏倚。常见于敏感问题,如未成年人的吸烟史、冶游史。例如,有些人有冶游史,可能会难于陈述实情。而对于一些职业危害进行调查,研究对象因涉及劳保福利等原因可能会夸大某些暴露信息。,3诊断怀疑偏倚(diagnosticsuspicionbias),由于研究者事先了解研究对象对研究
14、因素的暴露情况,于是带着“先入为主”的倾向性,怀疑其患某病或在主观上倾向出现某种阳性结果。如对暴露组或实验组进行非常仔细地检查,而对非暴露组或对照组则不然,从而使研究结果出现偏差,由此而产生诊断怀疑偏倚,此类偏倚多见于队列研究和临床试验。,4暴露怀疑偏倚(exposuresuspicionbias),与上述的诊断怀疑偏倚一样,研究者在收集并确定病例组的暴露比例时所具有的认真、细致程度远高于对照组,从而导致错误结论,此即暴露怀疑偏倚。这类偏倚多见于病例对照研究,如采用病史记录作为分析资料,因为询问病史的医生知道某些因素和某病发病有关,因此对病例组患者在询问病史时特别仔细,常有阳性的记录,而调查对
15、照组时则漫不经心,阴性结果很多。对两组对象以不同的调查方法进行调查,从而产生偏倚。,5错误分类偏倚(misclassificationbias),调查中使用的方法如果偏离了金标准,则将产生错误分类偏倚。在度量疾病状态和暴露状态都可能发生。每项诊断试验或测定仪器都有一定的灵敏度和特异度,但两者都不大可能是100%,于是就会出现假阳性和假阴性,这就发生了错误分类,即本应是病人,但错将他分入了对照组,而本应是非病人,则将他分入病例组。,(1)无差异错分(nodifferentialmisclassification)当se=se、sp=sp时产生,其实测结果往往低于真值,现以下例说明。表6-7是某队
16、列研究暴露组和非暴露组病例的真实分布情况。,表6-7暴露组和非暴露组病例的真实分布情况,RR=2,表6-8暴露组人员错分后的分布情况,现假设某诊断疾病方法的se=0.8、sp=0.9,则暴露组病例400人,该方法诊断为病人400*0.8=380人,另有80人漏诊,但另有600*(1-0.9)=60人误诊,故实际诊断为病人380人,诊断非病人为620人(表6-8)。,表6-9非暴露组人员错分后的分布情况,非暴露组中该方法诊断病人为2000.8=160人,误诊800*(1-0.9)=80,实际诊断病例数为240人诊断为非病人760人(表6-9)。,表6-10暴露组、非暴露组病例的实际分布情况,RR=1.583错分偏倚=(RR-RR)/RR=(1.583-2)/2=-0.209,(2)有差异错分(differentialmisclassification)当两组测定方法的灵敏度和特异度不同,则可产生有差异错分,资料的实际估计值可高于真值,也可低于真值,即可能高估也可低估研究因素与疾病之间的联系。,二、信息偏倚的控制,1搞好研究方法的质量控制。调查表的设计时,对所有调查内容、指标要