科研设计中的误差分析PPT课件

资源描述

《科研设计中的误差分析PPT课件》由会员分享，可在线阅读，更多相关《科研设计中的误差分析PPT课件（73页珍藏版）》请在金锄头文库上搜索。

1、科研设计中的误科研设计中的误差分析差分析1第一节第一节流行病学研究基本思维方法流行病学研究基本思维方法2一、研究的外部真实性与内部真实性一、研究的外部真实性与内部真实性1外外部部真真实实性性：指指研研究究样样本本的的结结果果和和结结论论可可以以外外推推到到研研究究的的总总体体人人群群。遵遵循循随随机机抽抽样样原原则则和和避避免免产产生生严严重重的的选选择择偏偏倚倚是是保保证证样样本本代代表表性性的的重重要要措措施。施。2内内部部真真实实性性：指指研研究究样样本本的的结结果果真真实实可可靠靠。严严格格控控制制和和减减少少测测量量偏偏倚倚和和混混杂杂偏偏倚倚对对结结果果的的影影响响，保证研究结果真

2、实性的关键。保证研究结果真实性的关键。3二、误差与偏倚二、误差与偏倚医医学学研研究究中中，从从研研究究设设计计、指指标标测测量量、数数据据分分析析到到结结果果推推论论均均可可因因设设计计和和处处理理不不当当而而产产生生各各种种各各样样的的误误差差(error)，其其中中因因人人为为因因素素造造成成的的观观察结果偏离真实值则被称为偏倚察结果偏离真实值则被称为偏倚(bias)。42.观察偏倚观察偏倚(observationalbiasorinformationbias)3.混杂偏倚混杂偏倚(confoundingbias)当当研研究究某某个个暴暴露露因因素素与与某某疾疾病病的的关关联联时时，由由于

3、于研研究究中中存存在在某某些些既既与与疾疾病病有有关关联联，又又与与所所研研究究暴暴露露因因素素有有联联系系的的外外部部因因素素影影响响，使使暴暴露露因因素素与与疾疾病病真真实实关关联联性性被被人人为为歪歪曲曲，这这种种导导致致研研究究结结果果存存在在误误差差的的现现象象叫叫混混杂杂。这这些些外外部部因因素素称称混混杂杂因因素素，由由它它们们产生的偏倚称混杂偏倚。产生的偏倚称混杂偏倚。5口服避孕药口服避孕药(OC)与心机梗死与心机梗死(MI)病例对照研究病例对照研究(未分层的分析结果未分层的分析结果)-服未服合计-对照-合计-cOR=(39/114)/(24/154)=.206口服避孕药口服避

4、孕药(OC)与心机梗死与心机梗死(MI)病例对照研究病例对照研究(按年龄分层后的结果按年龄分层后的结果)-=40岁-(+)(-)合计(+)(-)合计-2126471888106对照175976795102-合计388512325183208-OR12.80OR22.78对照对照:76/178=0.43;MI:47/153=0.31;40岁岁:25/208=0.127三、比较与对照三、比较与对照试试验验组组和和对对照照组组间间的的良良好好可可比比性性是是分分析析性性比比较较研研究究的的基基础础，是是保保证证研研究究结结果果内内部部真真实实性性的的关关键。键。1可比性：可比性：指比较的各组间在下述

5、方面的一致指比较的各组间在下述方面的一致（1）影影响响结结局局产产生生的的非非研研究究(外外部部混混杂杂)因因素素在在比较组间分布应相同。比较组间分布应相同。研究研究(暴露暴露)因素因素-结局结局外部混杂因素外部混杂因素8对于观察性研究对于观察性研究：病病例例对对照照研研究究病病例例组组和和对对照照组组间间，或或定定群群研研究究暴暴露露组组和和非非暴暴露露组组间间的的外外部部因因素素分分布布频频率率应应该该完完全全相同；相同；对于实验研究对于实验研究：临临床床试试验验(或或人人群群干干预预试试验验)中中的的治治疗疗(或或干干预预)组组与与对照组间外部因素的分布频率应该完全相同。对照组间外部因

6、素的分布频率应该完全相同。9(2)研研究究指指标标定定义义在在任任何何研研究究时时点点、任任何何研研究究参参加加单单位位或或研研究究者者均均应应该该采采用用相相同同的的指指标标定定义义，如如病病例例诊断标准等。诊断标准等。(3)组间采用的实验室检测方法应该相同。组间采用的实验室检测方法应该相同。(4)组间资料收集方法应该相同。组间资料收集方法应该相同。2统计学推断：统计学推断：以拒绝无效假设和接受备择假设作以拒绝无效假设和接受备择假设作为判断比较组间有无差异的根据。此外，比较两组为判断比较组间有无差异的根据。此外，比较两组95%可信限区间也是精确估计真实差异的重要方法。可信限区间也是精确估计真

7、实差异的重要方法。10四、因果推论四、因果推论现现场场观观察察研研究究和和临临床床试试验验或或现现场场实实验验研研究究所所获获得得的的因因素素与与结结局局之之间间的的关关联联，究究竟竟是是表表面面上上的的虚虚假假联联系系还还是是本本质质上上的的因因果果关关系系，必必须须经经过过因因果果推论的论证。推论的论证。1.首先确定研究结果有无偏倚的影响：首先确定研究结果有无偏倚的影响：存存在在严严重重偏偏倚倚的的研研究究资资料料不不宜宜用用来来进进行行统统计计学检验，不能用来确立因果关系。学检验，不能用来确立因果关系。112.确定因素与结局是否存在统计学上的关联：确定因素与结局是否存在统计学上的关联：关

8、联性研究获得的结果可做三种解释：关联性研究获得的结果可做三种解释：（1）真实的效应；）真实的效应；（2）机遇）机遇(随机误差随机误差)所致；所致；（3）由偏倚所致。）由偏倚所致。12统计学检验：统计学检验：帮帮助助研研究究者者了了解解该该OR、RR或或RD值值由由机机遇遇所所致致的的概率概率(P值值)P 0.05或或P 0.01：所所获获样样本本的的OR、RR或或RD值值是是因因机机遇遇而而非非暴暴露露因因素所致的可能性素所致的可能性 5%或或 1%；P0.05：无无论论是是观观察察性性研研究究还还是是实实验验性性研研究究所所获获的的结结果果，如如经经统统计计学学检检验验无无显显着着意意义义时

9、时，不不能能由由此此便便下下结结论论认认为为因因素素和和结结局局之之间间没没有有本本质质的的关关联联或或药药物物无无疗疗效效，可能还有样本数量是否足够大的问题需要考虑。可能还有样本数量是否足够大的问题需要考虑。133.按判断因果关系的原则确定研究结果的因果性质：按判断因果关系的原则确定研究结果的因果性质：任何一项观察性研究或实验性研究所获结果，任何一项观察性研究或实验性研究所获结果，若要下因果关系的结论，除要保证研究结果不存在若要下因果关系的结论，除要保证研究结果不存在任何偏倚的影响和经统计学检验证实存在统计学显任何偏倚的影响和经统计学检验证实存在统计学显著意义外，还必须按严格的判断因果关系的

10、下述法著意义外，还必须按严格的判断因果关系的下述法则进行逻辑关系的检验：则进行逻辑关系的检验：14原因和结局的时间顺续原因和结局的时间顺续(temporality)剂量反应关系剂量反应关系(doseresponserelationship)联系的强度联系的强度(strength)一致性一致性(consistency)合理性合理性(plausibility)实验证据实验证据(experimentevidence)15在有了严格的临床设计并实施后，会得到许多研究所需要的信息，如何运用概率论和数理统计的原理和方法来分析医学信息就是医学统计学的任务了。统计学是描述、归纳、探索数据分布规律、解释数据的科

11、学和艺术,也是研究人员合理地、灵活地运用统计学原理和方法,充分提取试验信息,深入揭示研究事物客观规律的一种手段。16二、二、统计学的内容统计学的内容1统计研究设计2统计资料的收集、整理、描述和表达3统计分析方法的选择4统计结果的解释17统统计计研研究究设设计计实验性研究（有干预）实验性研究（有干预）：优点：能够较好地控制非处理因素（即混杂因素）的影响，避免人为造成的偏倚，使要比较的组之间具有均衡性和可比性。缺点：如果样本量小时，不能保证非处理因素（即混杂因素）在组间有较好的均衡性和可比性。18对实验因素作有计划安排: 以人为受试对象的称谓临床试验设计临床试验设计以动物为实验对象的称谓实验

12、设计实验设计观察性研究（无干预）观察性研究（无干预）属于调查设计调查设计。19实验设计的三要素:实验因素实验单位实验效应20实验设计的四个基本原则:随机对照重复盲法21实验设计类型实验设计类型:随机对照试验随机对照试验（randomizedcontroltrail,RCT)交叉试验交叉试验（cross-overdesign)队列研究队列研究(cohortstudy)病例病例对照研究（对照研究（casecontrolstudy)22三、统计学方法实验设计资料收集整理统计分析参数估计（点估计、区间估计）假设检验：样本均数差数间的显著性检验样本率的差数间的显著性检验变量间的回归和相关问题23

13、四、应用中的错误-1.实验设计 1、随机化概念不清某文报道“120例肩周炎不同疗法的对比研究”中明确交代病人的分组方法,即“根据病情和就诊先后顺序分组,每组40人”。24对差错的分析:这里显然忽视了受试对象的分组应遵守“随机化原则”的要求。因为随机化是削弱或消除非试验因素对试验结果干扰和影响的重要措施之一。病人就诊的先后顺序,往往暗示其病情不同,尤其是当病人的病情轻重难以判断时,若将先来就诊者分为一组,后来就诊的分为另一组,则不可避免地引入顺序误差,从而得出错误的结论。252、假对照某人在研究某药物的治疗铅中毒的驱铅效果时，涉及如下试验,30名铅中毒工人脱离现场后住院治疗的结果观测指标治疗前治

14、疗后血铅(mg/L)0.1810.0290.0730.019*尿铅(mg/L)0.1160.0090.0870.010*与治疗前比p0.01结论:此药有明显的驱铅作用。26对错误地分析:本研究试图利用前后对照来说明此药的驱铅效果，统计分析的结果清楚的显示两组之间的差别具有非常显著性。但不能说明此药具有驱铅作用，因为脱离现场后即使不治疗亦有尿铅排出，实际上此研究成了具有“假对照”的研究。27正确的设计:如果仅有一种治疗方法需要考察其疗效,就必须有不给于任何治疗的空白对照组。如果患者都必须接受某种治疗,就必须具有两种或两种以上的不同治疗方法。283、对照不全研究者为研究ADI药物预防肠道传染病的效

15、果，设计如下试验：在甲幼儿园随机抽取大、中、小班儿童各50名组成试验组，服用ADI药物（剂量按年龄、体重严格计算）；在乙幼儿园随机抽取大、中、小班儿童各50名组成对照组，不服用ADI药物。但两个幼儿园参加此项试验的儿童的饮食、作息时间和体育活动情况是完全相同的。结果发现：甲幼儿园150名儿童肠道传染病的发病率明显低于乙幼儿园150名儿童肠道传染病的发病率（P0.001)。于是，研究者得出结论：ADI药物有预防肠道传染病的作用。29对错误地分析:本研究试图利用两个幼儿园并随机设立对照来说明ADI药物有预防肠道传染病的作用。但设计出现了问题，即使两个幼儿园参加此项试验的儿童的饮食、作息时间和体育活

16、动情况是完全相同的，但还有一些目前不了解的影响因素，因此，目前的设计不能得出作者的结论。30正确的设计：在甲、乙幼儿园分别随机抽取大、中、小班儿童各50名，然后按随机的原则，每个儿童均有相同的机会被分配到对照组或实验组，这样在每个幼儿园的每个班，均有对照组和实验组，已达到均衡可比。314、组间均衡性差在研究耐力训练与提高战士体质的关系时，设计了如下的实验：以血乳酸为主要观察指标，用20名连队的战士按训练方案进行耐力训练，以机关同龄的20名战士为对照，对照组进行日常活动，观察经4周训练后，两组战士进行一定量的运动时血乳酸的变化。两组战士训练前后血乳酸两组战士训练前后血乳酸（mg/L）的观测结果的

17、观测结果组别训练前训练后训练组38.23.533.13.1*对照组40.04.038.93.5*与训练前比p0.01;与对照组比p0.050.05471.标准差大于均数2.资料不符合正态分布3.方差不满足齐性要求482、错误使用t检验胃癌或巨型胃溃疡13人，在实行全胃切除术前后的体重（kg）如下：试比较手术前后体重有无变化？术前42.548.039.046.058.547.539.058.051.043.038.050.057.5术后52.051.545.052.549.055.052.052.050.550.041.051.572.2本题目经t检验，得到t=1.536p=0.138，于是得到

18、手术前后体重无显著性变化的结论。49对错误的分析：本项目本身用的设计是自身治疗前后的两次测定，用选用配对t检验的方法。GroupStatisticsNMeanS.DS.E术前 1347.5385 7.25852.0131术后 1351.8615 7.08751.9657而错误的选用独立样本检验时加大了误差，计算t=1.536p=0.138，使本来差异有显著性的变为无显著性。50按配对设计进行的检验结果PairedSamplesStatisticsNMeanStd.Deviation Std.ErrorMeanPair1 疗前1347.53857.25852.0131疗后1351.86157.0

19、8751.9657PairedDifferencesMean Std.Deviation Std.ErrorMeantSig.(2-tailed)-4.32316.86711.904-2.270.042统计结果：p0.05手术前后体重有显著性变化，术后体重增加。513、t检验代替方差分析测量三组人的舒张压（mmHg），数据如下：A组B组C组13513013812614013913613214013213814113513814213613814013914113813314013714014213614114314552NMean Std. DeviationStd. Error10135.3

20、 4.37 1.3810138.2 4.18 1.3210139.6 2.63 .8353组别tp1-21.5150.1471-32.6640.0162-30.8950.3825455t检验与方差分析的比较检验与方差分析的比较比较的内容t检验方差分析加q检验资料的利用率低：每次仅用两组高：每次要用全部数据对原试验设计的影响残：割裂了整体设计全：与原试验设计呼应犯假阳性错误的概率大：1-（1-0.05）n小：=0.05结论的可靠性低：统计量的自由度小高：统计量的自由度大df=n1+n2-2组内误差的自由度564、重复测定数据的处理重复测量资料系指同一受试对象的某项观测指标进行多次测量所得的数据。

21、这类数据间往往有相关性存在，违背了方差分析要求数据满足独立性的基本条件。此时若用一般方差分析方法，将会增大犯I类错误的概率。单因素重复测量资料的方差分析1、方差分析方法同随机区组资料的方差分析。2、两两比较时可进行两组资料之间的配对t检验，但检验水准需进行转换，=/k，k是进行两两比较的次数57两种不同剂型在血中的浓度（g/ml）剂型受试者服药后测定时间（j)(i)K1h2h4h6h8h1胶2囊3组.I=18片1剂2组3I=2.858方差分析表变异来源离均差平方和自由度Fp组间（剂型）2635.8114.030.0645组内（时间）41880.79450.770.0001剂型时间951.194

22、1.150.3413（剂型）对象9163.5514误差11548.6456合计66179.9879经过调整系数统计学推断：不同剂型药物的血液浓度间的差别无统计学意义，不同时间的血药浓度间的差别有统计学意义，剂量与时间之间无明显的交互作用。59应用中的错误4.相关和回归的应用研究在专业上有一定联系的两个定量变量之间呈直线关系研究在专业上有一定联系的两个定量变量之间呈直线关系的密切程度和方向的统计分析方法称为直线相关分析。的密切程度和方向的统计分析方法称为直线相关分析。相关分析：1、计算相关系数r2、对相关系数进行检验3、结合专业知识，评价此相关方法是否有临床实用价值4、计数资料用Spearman

23、秩相关60 研究在专业上有一定联系的两个定量变量中一个变量随另研究在专业上有一定联系的两个定量变量中一个变量随另一个变量变化的依赖关系的统计分析方法称为直线回归分析。一个变量变化的依赖关系的统计分析方法称为直线回归分析。依据自变量的个数回归分类为：自变量仅有一个时为一元回归分析自变量有多个时为多元回归分析若自变量个数相同，但同时考察有联系的多个应变量时，称为多重回归分析。61为研究小鼠S78-3肉瘤体积Y(cm3)随时间X(日)增长规律,将以下数据回归分析,所得结果如下：时间(日)0691113151719212325272931肉瘤体积0.00420.03080.06140.074

24、40.10280.15160.2101(cm3)0.33900.52010.76231.10201.56902.02142.7661Y=-0.7178+0.00803xt=-2.527p=0.027r=0.8496263若按因变量的性质分类为：若按因变量的性质分类为：因变量为连续性变量时因变量为连续性变量时为非时间的连续性变量(如：身高、体重、血压、胆固醇含量等)，可用一元、多元回归分析，可直线化的曲线回归分析等。为时间变量（如：患者治疗后的生存时间、复发时间等等），需要运用生存分析中的回归分析方法，如COX半参数回归分析或特定的参数回归模型进行分析。为随时间变化的连续型随机变量（如：某

25、种流行病的发病率等），则通常运用时间序列分析。64因变量为离散性变量时因变量为离散性变量时为二值变量（如：患者经过治疗后在规定的一段时间内存活情况，常分为“生存”、“死亡”两种情况，患者经过治疗后在规定的一段时间内复发情况，常分为“复发”、“未复发”两种情况，等等）此时，若自变量多为连续性变量，可考虑选用多元逐步Logistic回归分析；若自变量多为定性变量，可考虑选用有序变量的多元逐步Logistic回归分析。为多值有序变量（如：患者经过治疗后的疗效，分为治愈、显效、好转、无效、死亡；糖尿病患者经过一段时间治疗后血糖的测定结果可分为、，等等）此时可用有序变量的多元逐步Logistic回归

26、分析。65 多变量分析多变量分析 logistic 回归已成为现代流行病学危险因素研究的首选方法。在病因和发病因素的研究中，危险因素和疾病的关系是非常复杂的，各种危险因素之间可以相互影响，它们对结果的影响大小也不同。 logistic 回归能在复杂关系中平衡多种混杂因素的作用，进一步筛选出主要的危险因素，及其在决定病因和发病因素中的相对比重。 66为多值名义变量为多值名义变量（如研究者关心的结果变量为血型，分为O、A、B、AB型，等等）此时若自变量为定性变量，多用对数线性模型。若自变量为连续变量，可用多项logit模型回归分析 67应用中的错误5.样本含量的估算样本含量估计充分反映科研设计中

27、“重复”的原则，过大过小都有些弊端。样本量过大导致浪费（人力、时间、物力）、引入更多混杂因素，对研究结果造成不良影响。样本量过小，导致检验效能过低，出现“假阴性”结果。样本含量(samplesize)是临床科学研究中一个非常重要的组成部分。68 选择样本含量不当某研究者为了证明A(HP-1000型超声诊断仪)和B(研究者自制的成像系统)两台仪器测定的结果无差别,作了如下实验设计:选择一个健康人作为受试对象,用A、B两台仪器前后两次(间隔1个月)对此人分别重复测定4次。观测定量指标分别为:二尖瓣前叶EC幅度、左室右壁运动幅度、R-R间期。数据处理方法:每个指标下有4个数据,对其进行方差齐性检验

28、,然后作了配对t检验,结果为p值均大于0.10,结论为两台仪器的测定结果无差别,可用自制的成像系统取代费用很高的同类进口仪器。69对差错的分析:样本量太少,实际临床应用中每台仪器每天要测定多个受试着,由于不同受试者之间存在很大的个体差异,两台仪器对某一个人的测定结果之间无差别,并不能推出在多数人身上测定的结果之间的差别也一定无显著性。70正确的设计:本研究涉及3个因素:实验因素仪器,两个区组因素测定时间和受试对象。应选用交叉设计安排实验(若变异较小n=6或n=8即可)。71交叉实验设计格式受试对实验因素的水平编号及观测指标(单位)象编号实验顺序 I II 1 A( ) B( ) 2 B( ) A( ) 3 B( ) A( ) 4 A( ) B( ). 72个人观点供参考，欢迎讨论

展开阅读全文

科研设计中的误差分析PPT课件

最新文档