流行病学数据分析处理方法

上传人:s9****2 文档编号:567303969 上传时间:2024-07-19 格式:PPT 页数:35 大小:367KB
返回 下载 相关 举报
流行病学数据分析处理方法_第1页
第1页 / 共35页
流行病学数据分析处理方法_第2页
第2页 / 共35页
流行病学数据分析处理方法_第3页
第3页 / 共35页
流行病学数据分析处理方法_第4页
第4页 / 共35页
流行病学数据分析处理方法_第5页
第5页 / 共35页
点击查看更多>>
资源描述

《流行病学数据分析处理方法》由会员分享,可在线阅读,更多相关《流行病学数据分析处理方法(35页珍藏版)》请在金锄头文库上搜索。

1、培霉凤竟净回蛇彤皿翘售倪躁姻隙冠坪券冀蛀醒型琶他钨积英傣俄九质颅流行病学数据分析处理方法流行病学数据分析处理方法流行病学数据的分析处理方法流行病学数据的分析处理方法山东大学公共卫生学院山东大学公共卫生学院School of Public HealthShandong University流行病与卫生统计学研究所流行病与卫生统计学研究所编绷藏谐攒莎啸从臭挡展陀垛靶罩茁贬硫搅员溪哺葵唱隧花蓟冯障访蔷估流行病学数据分析处理方法流行病学数据分析处理方法1山东大学公共卫生学院山东大学公共卫生学院流行病学数据分析前的准备工作流行病学数据分析前的准备工作 一、原始数据的检查一、原始数据的检查 在数据分析前需

2、要对原始的流行病学调查研究数据进行一在数据分析前需要对原始的流行病学调查研究数据进行一次次审查审查,发现可能存在的错误、遗漏的研究变量取值和其他问,发现可能存在的错误、遗漏的研究变量取值和其他问题,并题,并采取相应的措施进行处理采取相应的措施进行处理。u若在调查表中发现有若在调查表中发现有缺失的数据缺失的数据,可以通过电话再次询问,可以通过电话再次询问研究对象、查阅有关的记录、应用储存的血液标本重新检研究对象、查阅有关的记录、应用储存的血液标本重新检测或再次取样等措施进行补充。测或再次取样等措施进行补充。u若发现若发现逻辑错误逻辑错误,也要及时改正。需要对调查问卷进行编,也要及时改正。需要对调

3、查问卷进行编码或者对已编码的问卷进行核查,避免重复和遗漏。码或者对已编码的问卷进行核查,避免重复和遗漏。 珊喘雀哥做里吠冻弱协忽茬密诊兑峭义泉饮盟仍沉勇忍浸吾墨叉嘎升寄忍流行病学数据分析处理方法流行病学数据分析处理方法2山东大学公共卫生学院山东大学公共卫生学院 二、选择合适的数据管理和数据分析软件二、选择合适的数据管理和数据分析软件u常用的数据管理软件常用的数据管理软件 Microsoft FoxProMicrosoft FoxPro、Microsoft AccessMicrosoft Access、Microsoft ExcelMicrosoft Excel 这些数据管理软件也具有简单这些数

4、据管理软件也具有简单的数据分析功能,的数据分析功能,ExcelExcel的数据分析功能更强,不的数据分析功能更强,不仅可实现描述性统计,还可以做仅可实现描述性统计,还可以做t t检验、方差分析、检验、方差分析、相关回归分析等相关回归分析等u常用的数据分析软件常用的数据分析软件 SASSAS(Statistical Analysis SystemStatistical Analysis System)和和SPSSSPSS(Statistical Package for Social Statistical Package for Social ScienceScience),它们均具有很强的数据

5、分析和数据管,它们均具有很强的数据分析和数据管理的功能理的功能绝咨姚捷缆佩绣噎碧茂析宙鼠韵夹刀哲做井腔诗划评酝醚震邮怂址晓娥锦流行病学数据分析处理方法流行病学数据分析处理方法3山东大学公共卫生学院山东大学公共卫生学院 三、数据的计算机录入三、数据的计算机录入 ( (编号、定义变量名、变量数量化)编号、定义变量名、变量数量化)u编号:给编号:给每一个每一个调查表或调查对象调查表或调查对象一个一个编号以编号以识别录入的数据与调查表或调查对象的对应关识别录入的数据与调查表或调查对象的对应关系系(唯一性)(唯一性)p使用阿拉伯数字使用阿拉伯数字1 1、2 2、33等给每份调查表按照顺等给每份调查表按照

6、顺序编号,这样有利于以后对输入的数据进行检查、序编号,这样有利于以后对输入的数据进行检查、核对与修改错误。核对与修改错误。p可以给编号以时间、地区、单位、调查对象编号等,可以给编号以时间、地区、单位、调查对象编号等,如:如:200501200501(济南)(济南)0202(历下)(历下)00010001(调查对象)(调查对象) 菇喜析昔掖霓深犊秩半苹叫昭赚劫淀夏院奇椭违总榨协餐卞言晋只憾攒殴流行病学数据分析处理方法流行病学数据分析处理方法4山东大学公共卫生学院山东大学公共卫生学院 u定义变量名称:定义变量名称:命名:可以应用中文、拼音、也可以应用英文,但以命名:可以应用中文、拼音、也可以应用英

7、文,但以使用拼音或英文为好,这样可以方便输入。使用拼音或英文为好,这样可以方便输入。注意:注意:p变量名应简短、易懂易记:如对性别、年龄、身高、体重可变量名应简短、易懂易记:如对性别、年龄、身高、体重可以使用以使用gender, age, height 和和weight进行命名。对名称较进行命名。对名称较长的变量,可以使用长的变量,可以使用简写简写,如,如wt表示表示weight、ht表示表示height。p标记或说明:有些数据管理和分析软件可变量进行标记或说标记或说明:有些数据管理和分析软件可变量进行标记或说明,避免时间长久了而忘记数据库中的变量名字,如对上述明,避免时间长久了而忘记数据库中

8、的变量名字,如对上述Wt可标记为可标记为“weight”。 斥夜怎未耸毖秽启蓑豺破椎柄己孟诗匿欠分副田蹦念驶堂钮青锑誊耕俏檀流行病学数据分析处理方法流行病学数据分析处理方法5山东大学公共卫生学院山东大学公共卫生学院 u变量数量化变量数量化 如果调查表的设计是如果调查表的设计是编码式编码式的,则此步骤的,则此步骤可省略,可省略,直接直接将变量取值编码的结果输入计算机。将变量取值编码的结果输入计算机。 若若不是编码式不是编码式的调查结果,则需要对变量的调查结果,则需要对变量的取值结果进行的取值结果进行编码编码( (数量化)数量化)。 削白忱汰审跺举痛迹片仲蓬蚌脑焦堑搭亲效纺是楞狞棘浴收召共坎票邪吓

9、流行病学数据分析处理方法流行病学数据分析处理方法6山东大学公共卫生学院山东大学公共卫生学院 l常见变量的类型常见变量的类型 1 1、字符型、字符型(character type)(character type): 输入字符如中文或英文输入字符如中文或英文 2 2、数值型、数值型(numerical type)(numerical type): 以数值的形式输入以数值的形式输入 3 3、日期型、日期型(data type)(data type): 按照规定的格式输入日期数值按照规定的格式输入日期数值 4 4、逻辑性(、逻辑性(logical typelogical type): : 圾扔隘慷驯略

10、奉讥瞧衫牵恍瞧奋模莆散镭介寸壬顽碘子右魄攀虾色众骤天流行病学数据分析处理方法流行病学数据分析处理方法7山东大学公共卫生学院山东大学公共卫生学院 l变量数量化时应注意:变量数量化时应注意: (1)除日期型变量外)除日期型变量外尽量使用数值型变量尽量使用数值型变量 (2)某些数值变量)某些数值变量(numerical variable)可可直接输入变量的取值直接输入变量的取值,如研究对象的身高、体,如研究对象的身高、体重、血压水平等。重、血压水平等。 (3)分类变量分类变量(categorical variable)及有及有 序变量序变量(ordinal variable)则可将其取值进行则可将其

11、取值进行量化量化,然后再输入计算机,然后再输入计算机 三圆冷祟霍贪荚矿累锡炉植府斩行向眺诞享侗焰窜蛙蜘通妨版舅版趾翁半流行病学数据分析处理方法流行病学数据分析处理方法8山东大学公共卫生学院山东大学公共卫生学院 如:分类变量如:分类变量如:分类变量如:分类变量种族种族种族种族 白人白人1 黑人黑人2 西班牙裔人西班牙裔人3 亚太裔亚太裔4 其它种族其它种族5注意:注意: 分类变量在进行多因素分析时,分类变量在进行多因素分析时,必须转换成哑变量必须转换成哑变量(dummy variabledummy variable),不能直接将前述的取值),不能直接将前述的取值1 1、2 2、3 3、4 4、5

12、 5放入方程中进行分析。放入方程中进行分析。 瘩履蓝迟伦躲笨伦否娩际尹漆单阳缆炭膨坟讼字尤擒泪慌出纸绵姿绣触沃流行病学数据分析处理方法流行病学数据分析处理方法9山东大学公共卫生学院山东大学公共卫生学院 l有序变量的数量化顺序合理,则可以直接进行分析有序变量的数量化顺序合理,则可以直接进行分析 如:教育程度如:教育程度 文盲:文盲:0 小学:小学:1 中学:中学:2 高中及中专:高中及中专:3 大学:大学:4 硕士及以上:硕士及以上:5冯奏胸镭服豌粕盔菏嗡舷咳疡逾嚣岿丫轨摄俞淄忘脐凑大逻唤吾乐寅题卸流行病学数据分析处理方法流行病学数据分析处理方法10山东大学公共卫生学院山东大学公共卫生学院 四、

13、数据的检查与核对四、数据的检查与核对四、数据的检查与核对四、数据的检查与核对 (一)检查数据库结构(一)检查数据库结构(一)检查数据库结构(一)检查数据库结构 数据库样本数(观测数)、变量数、变量名称及定义数据库样本数(观测数)、变量数、变量名称及定义数据库样本数(观测数)、变量数、变量名称及定义数据库样本数(观测数)、变量数、变量名称及定义等。等。等。等。(二)检查各变量的取值情况(二)检查各变量的取值情况(二)检查各变量的取值情况(二)检查各变量的取值情况 查看变量取值范围,有无逻辑错误:查看变量取值范围,有无逻辑错误:查看变量取值范围,有无逻辑错误:查看变量取值范围,有无逻辑错误:如性别

14、如性别如性别如性别应有两个应有两个应有两个应有两个取值,若有取值,若有取值,若有取值,若有2 2个以上的取值,说明存在错误个以上的取值,说明存在错误个以上的取值,说明存在错误个以上的取值,说明存在错误 。 对数据变量要检查其最小值对数据变量要检查其最小值对数据变量要检查其最小值对数据变量要检查其最小值(minimum)(minimum)、最大值、最大值、最大值、最大值(maximum)(maximum)、均数、均数、均数、均数(mean)(mean)、中位数、中位数、中位数、中位数(median)(median),并查,并查,并查,并查看是否有异常取值看是否有异常取值看是否有异常取值看是否有异

15、常取值(outlier)(outlier),如极小值及极大值。,如极小值及极大值。,如极小值及极大值。,如极小值及极大值。 异常值若影响显著时应删除异常值若影响显著时应删除异常值若影响显著时应删除异常值若影响显著时应删除入曳纷恢屁录稳姚途酋缅视胖卡样缀诵鹃贼恳酋闯淹正添钙傣误悼僳反挖流行病学数据分析处理方法流行病学数据分析处理方法11山东大学公共卫生学院山东大学公共卫生学院 五、数据的整理五、数据的整理(一)数据分组(一)数据分组l分类变量:分类变量: 按其原有的分类进行分组,若有必要,按其原有的分类进行分组,若有必要,可将性质相近或差别不大的类别进行合并。如教育程可将性质相近或差别不大的类别

16、进行合并。如教育程度。度。l数值变量:数值变量: 按照按照实际的生理、病理或临床意义分组实际的生理、病理或临床意义分组,如体重,如体重指数:低体重、正常体重、超重和肥胖指数:低体重、正常体重、超重和肥胖 潮雀报叼乍甲忍帅汕劲套逢蜗少疯侥缎侈余哲嗣陇潜哼邵祖忆友绊脑烈时流行病学数据分析处理方法流行病学数据分析处理方法12山东大学公共卫生学院山东大学公共卫生学院 按使用的按使用的方便程度和专业上惯用方便程度和专业上惯用的方法分的方法分组,如年龄在某一个合适的范围内每组,如年龄在某一个合适的范围内每5 5岁或岁或1010岁岁分成一组。分成一组。 按按分位数分组分位数分组,即首先找出四分位数,即首先找

17、出四分位数(quartile)或五分位数()或五分位数(quintile)的界值,然)的界值,然后应用这些界值将研究对象平均分成后应用这些界值将研究对象平均分成4组(每组组(每组25%的研究对象)或的研究对象)或5组(每组组(每组20%的研究对象)。的研究对象)。网阔兢氟洛铰串纷裹种险乃茸师放矾碳歼萎回粒棘坑狂慎纪譬堪利年凯熄流行病学数据分析处理方法流行病学数据分析处理方法13山东大学公共卫生学院山东大学公共卫生学院 (二)数据的转换二)数据的转换1、非正态数据的变量转换、非正态数据的变量转换原理:原理: 正态分布正态分布 参数检验参数检验(parametric test) 非正态数据非正态数

18、据非参数检验非参数检验(non-parametric test) (不是对原始数据检验)如:秩和检验(不是对原始数据检验)如:秩和检验 (是对(是对原始数据的秩次检验)原始数据的秩次检验)检验:正态性检验、方差齐性检验检验:正态性检验、方差齐性检验 方法:对数变换;平方根变换;倒数变换方法:对数变换;平方根变换;倒数变换 疟娠岩些四电浩波缝粮蹭芹迎红裳附憾堑诱蔼炊喜州寓由亲艘邦疲浙骸掳流行病学数据分析处理方法流行病学数据分析处理方法14山东大学公共卫生学院山东大学公共卫生学院 2 2、分类变量转换成哑变量、分类变量转换成哑变量u原理:原理: 分类变量是分类变量是二分类尺度及顺序尺度二分类尺度及

19、顺序尺度,则可直接应用其原有的数量化数值。则可直接应用其原有的数量化数值。 名义尺度名义尺度因为各类别间没有顺序关因为各类别间没有顺序关系,在进行不同分析(包括多元分析、系,在进行不同分析(包括多元分析、logisticlogistic回归、回归、CoxCox回归等)时,不能使用原回归等)时,不能使用原始的计算机录入数值,必经进行变量转换始的计算机录入数值,必经进行变量转换。即将该变量转换成(水平数即将该变量转换成(水平数-1-1)个哑变量)个哑变量,再将这些新转换的变量放入多因素模型中。再将这些新转换的变量放入多因素模型中。 讹茫叙奋侠叼匀史阜缘攒儒歌沈冉血诬艾遏伐果厦刊盈锯茫撤挂归啸缚拔流

20、行病学数据分析处理方法流行病学数据分析处理方法15山东大学公共卫生学院山东大学公共卫生学院 u方法:方法: 例如:将种族原始取值转换成哑变量(新变量)例如:将种族原始取值转换成哑变量(新变量) 表表1. 分类变量转换成哑变量的方法分类变量转换成哑变量的方法 新变量新变量 .种族种族 原始取值原始取值(x1) x1-1 x1-2 x1-3 x1-4白人白人 1 0 0 0 0黑人黑人 2 1 0 0 0亚太裔亚太裔 3 0 1 0 0西班牙裔人西班牙裔人 4 0 0 1 0其它种族其它种族 5 0 0 0 1新变量以白人为参照,新变量以白人为参照,X1X11 1表示黑人与白人比较,依此类推表示黑

21、人与白人比较,依此类推磨臣吭晨瘪柞逊涧椅镊须坝课幽钞仰志依迟雾劝锥杭她梨蜂楔输庇憎射辊流行病学数据分析处理方法流行病学数据分析处理方法16山东大学公共卫生学院山东大学公共卫生学院 六、确定拟分析的因变量和应变量六、确定拟分析的因变量和应变量l因(自)变量因(自)变量(independent variable):是指是指影响疾病的发生或健康状况的分布的变量,是影响疾病的发生或健康状况的分布的变量,是原因变量原因变量 、已知变量、已知变量、x变量。变量。l应变量应变量(dependent variable):是指随因变量是指随因变量的变化而发生变化的变量,是结果变量、预测的变化而发生变化的变量,是

22、结果变量、预测变量、变量、y变量。变量。 应变量是在自变量作用下产生反应的变量应变量是在自变量作用下产生反应的变量唉仔竣追题嫁需哗霄致汁瞅僧挥损遏诈钩化乔硒撰微曰喉村昔阵脂痈褪企流行病学数据分析处理方法流行病学数据分析处理方法17山东大学公共卫生学院山东大学公共卫生学院 意义意义l有助于选择拟研究的变量:有助于选择拟研究的变量:对调查表的设计具有指导对调查表的设计具有指导作用作用 l可以指导数据分析方法的选择可以指导数据分析方法的选择: 因变量是分类变量:因变量是分类变量:采用采用2检验,检验,logistic回归回归分析等。分析等。 因变量是数值变量:因变量是数值变量:采用采用t检验、方差分

23、析,协检验、方差分析,协方差分析、多元回归等方差分析、多元回归等 。 l有助于模型的建立有助于模型的建立 :应变量(:应变量( y )放在模型的左侧,)放在模型的左侧,因变量(因变量(x )放在模型的右侧。)放在模型的右侧。派啼浓陷颊趣迭窜埂霍蜕丹读贡毫私精强徊尾巴来货威肮颁多订坚票眼葵流行病学数据分析处理方法流行病学数据分析处理方法18山东大学公共卫生学院山东大学公共卫生学院 l例例1. 欲评价不同治疗方法(口服药物、注射胰岛素及欲评价不同治疗方法(口服药物、注射胰岛素及膳食控制)对糖尿病人的治疗效果(血糖水平),分膳食控制)对糖尿病人的治疗效果(血糖水平),分析时要求调整病人的性别、年龄和

24、病程的影响析时要求调整病人的性别、年龄和病程的影响。 血糖水平(应变量血糖水平(应变量y y)= =治疗方法(因变量治疗方法(因变量x)+x)+其它协变量其它协变量 (covariate,性别、年龄和病程),性别、年龄和病程)l例例2. 欲分析脂蛋白(欲分析脂蛋白(a)与冠心病发生的关系。)与冠心病发生的关系。 冠心病冠心病( (应变量应变量y)=y)=脂蛋白脂蛋白(a)(a)(因变量因变量x)x) 蛹盛筷渐憨腋傍喂确二禁碘中百芍脚乘烬瑰榷渣篓絮材战瀑屡慎饵豺五泪流行病学数据分析处理方法流行病学数据分析处理方法19山东大学公共卫生学院山东大学公共卫生学院 七、缺失数据(七、缺失数据(missi

25、ng data)的处理)的处理 l缺失数据:是指其测量结果缺失。缺失数据:是指其测量结果缺失。 产生的原因:产生的原因:p问卷调查:遗漏出生日期和年龄,调查结束后又无法补救问卷调查:遗漏出生日期和年龄,调查结束后又无法补救p实验室检测:血脂或血糖因为血清量不足或研究对象拒绝采血实验室检测:血脂或血糖因为血清量不足或研究对象拒绝采血而致而致p过去处理:仅用无缺失的数据进行分析过去处理:仅用无缺失的数据进行分析损失样本量损失样本量 缺失数据缺失数据“合理合理”赋值赋值人为人为赋值不一定合理赋值不一定合理瓮吨情斌洒陈忙缨凛丝租遭星压淑虏脐伎托习烩籽己廓除连博刷铺筒砧阁流行病学数据分析处理方法流行病学

26、数据分析处理方法20山东大学公共卫生学院山东大学公共卫生学院 u现在处理现在处理 数据分析处理件软处理数据分析处理件软处理 :SAS自动分析处理自动分析处理 如一个数据库中有性别和年龄等变量,性别有如一个数据库中有性别和年龄等变量,性别有1010个缺个缺失数据,年龄有失数据,年龄有3 3个缺失数据:个缺失数据:分析性别时不包括性别缺失的分析性别时不包括性别缺失的10个个体个个体分析年龄时不包括缺失年龄的分析年龄时不包括缺失年龄的3个个体个个体当分析中(如多因素分析)共同使用了性别和年龄时,分析当分析中(如多因素分析)共同使用了性别和年龄时,分析的实际样本数量是性别和年龄这两个变量均不含缺失数据

27、的的实际样本数量是性别和年龄这两个变量均不含缺失数据的样本样本 卖袖驼谨已步兔坑租丰剂堤辰魏呜秆毛成骡狙恃河迸翰炒反茄偏卫缮惜豆流行病学数据分析处理方法流行病学数据分析处理方法21山东大学公共卫生学院山东大学公共卫生学院流行病学数据分析方法的选择流行病学数据分析方法的选择一、流行病学数据的分析程序一、流行病学数据的分析程序 数值变量数值变量 正态性检验正态性检验 正态正态 数据转换数据转换 非正态非正态 参数检验参数检验 非参数检验非参数检验 图图1. 数值变量的分析程序数值变量的分析程序 挥熊畸步具彪迟零弊氛愧拯泣虱谗妥峻剐擒垣掉痒瞄悲曾看淤一蕊辰基顾流行病学数据分析处理方法流行病学数据分析

28、处理方法22山东大学公共卫生学院山东大学公共卫生学院 单因素分析单因素分析 2检验检验 分类变量分类变量 分层分析分层分析 多因素分析多因素分析 logistic回归分析回归分析 Cox回归分析回归分析 其它分析方法其它分析方法 图图2. 2. 分类分类变量的分析程序变量的分析程序 账哩诀登狮姥发藐昭腑叛嚏蝶渔炮谐逝驻晋晓淆澎妨簇窘鹃酞郧歪掌迸咬流行病学数据分析处理方法流行病学数据分析处理方法23山东大学公共卫生学院山东大学公共卫生学院 二、根据研究设计类型选择二、根据研究设计类型选择 (一)成组比较的设计(一)成组比较的设计 两组比较:两组比较:t t检验或检验或2 2检验检验多组比较:方差

29、分析、行多组比较:方差分析、行列表列表2 2检验检验病例对照研究:按其分析方法分析病例对照研究:按其分析方法分析分级的病列对照研究:按其分析方法分析分级的病列对照研究:按其分析方法分析(二)配对(自身实验前后)设计(二)配对(自身实验前后)设计配比的配比的t t检验、检验、2 2检验检验配对的病例对照研究方法进行数据配对的病例对照研究方法进行数据 旱译彼漫潭接遵旗揖糠亥迷伦惠捌智赐劈镁砌衣毕文溜诞配佰写途剿俄捉流行病学数据分析处理方法流行病学数据分析处理方法24山东大学公共卫生学院山东大学公共卫生学院 (三)重复测量的设计(三)重复测量的设计 在给定一个处理因素后在不同的时间重复测量某在给定一

30、个处理因素后在不同的时间重复测量某一效应变量的改变情况。如欲评价生物制品接种后的一效应变量的改变情况。如欲评价生物制品接种后的免疫学效果,在接种后的免疫学效果,在接种后的2 2周、周、4 4周、周、6 6周和周和8 8周测定抗周测定抗体滴度:体滴度:重复测量的方差分析方法重复测量的方差分析方法 (四)多因素设计(四)多因素设计自变量是数值变量:多元回归分析方法、协方差分自变量是数值变量:多元回归分析方法、协方差分析方法析方法 自变量分类变量:自变量分类变量:logisticlogistic回归分析方法、判别分回归分析方法、判别分析方法、聚类分析方法析方法、聚类分析方法 瑚姥矩加挝眶褒熄端尿腋老

31、世拱转韦惧癸嘱掠小忠棍哥鸥烩棘垄镊遥景戚流行病学数据分析处理方法流行病学数据分析处理方法25山东大学公共卫生学院山东大学公共卫生学院 三、根据变量的类型选择三、根据变量的类型选择 因变量 应变量(y) (x) 数值变量 分类变量有序变量数值变量相关分析,多元回归分析 t检验,方差分析,协方差分析,多元回归分析 相关分析,多元回归分析 分类变量t检验,方差分析,logistic回归分析,判别分析,聚类分析 2检验,logistic回归分析 2检验有序变量方差分析,logistic回归分析,判别分析,聚类分析 2检验,logistic回归分析 相关分析, 2检验 生存时间生存分析 表表表表2. 2

32、. 2. 2. 不同变量类型的数据分析方法选择不同变量类型的数据分析方法选择不同变量类型的数据分析方法选择不同变量类型的数据分析方法选择土藕晰捶作别霍烘低慑啸头旱激彩忿辆萧亏自处炭弛蛙尸芋蓬燕然坝嫂吩流行病学数据分析处理方法流行病学数据分析处理方法26山东大学公共卫生学院山东大学公共卫生学院表表3. 3. 不同研究设计和数据类型的数据分析方法选择不同研究设计和数据类型的数据分析方法选择 研究设计类型变量类型 两组比较两组以上比较实验前后比较重复测量两变量间的联系数值变量t检验方差分析配对t检验重复测量的方差分析线性回归Pearson相关系数 分类变量2检验2检验配对2检验列联表相关系数 有序变

33、量Mann-Whitney秩和检验 Kruskal-Wallis分析(成组设计多个样本比较的秩和检验 )Wilcoxon符号秩和检验 (配对设计差值的符号检验)Spearman相关系数 生存时间生存分析吓傈趁酱忙如角掇冕均沤帝毛猾运眨影裴歌沤厢刻辅匠绰铲头跋宏命扯唬流行病学数据分析处理方法流行病学数据分析处理方法27山东大学公共卫生学院山东大学公共卫生学院不同流行病学研究类型的数据分析方法不同流行病学研究类型的数据分析方法一、描述性研究一、描述性研究 (一)现况研究(一)现况研究分布描述:患病率、危险因素流行率、数值变量分布分布描述:患病率、危险因素流行率、数值变量分布探讨因素:相关回归分析、

34、探讨因素:相关回归分析、2 2检验、检验、t t检验、方差分析、多因检验、方差分析、多因素分析、人群归因危险度素分析、人群归因危险度 (二)生态学研究(二)生态学研究 同现况研究同现况研究(三)筛检(三)筛检筛检试验的真实性和可靠性筛检试验的真实性和可靠性 人群中疾病、健康状况、危险因素筛选结果分析方法:同现况人群中疾病、健康状况、危险因素筛选结果分析方法:同现况研究研究 醋硬油铃郸恶赃榔烯籽馈架钉寥褐冈棵拒腐驾钥羞朝秦卡俘圭瑟悍别雹轮流行病学数据分析处理方法流行病学数据分析处理方法28山东大学公共卫生学院山东大学公共卫生学院(一)病例对照研究 病例对照研究数据病例对照研究数据 成组设计成组设

35、计 配比设计配比设计 粗粗OR分级分级OR剂量反应剂量反应 分层分层OR 分级分级OR剂量反应剂量反应 (趋势趋势2检验检验) (趋势趋势2检验检验 )分层分层OR 混杂与效应修饰分析混杂与效应修饰分析混杂与效应修饰分析混杂与效应修饰分析 图图3. 3. 病例对照研究数据的分析程序病例对照研究数据的分析程序 二、分析性研究的数据分析方法二、分析性研究的数据分析方法掩掠奸奋下扫篙掐溜辈慷驾透钧刺酋叶刑甩毁诱蛤丛攒耍来趾汾活夕蓝木流行病学数据分析处理方法流行病学数据分析处理方法29山东大学公共卫生学院山东大学公共卫生学院(二)队列研究二)队列研究 队列研究数据队列研究数据 人时、发病密度人时、发病

36、密度/累积发病率累积发病率 粗粗RR、AR、AR%、PAR及及PAR%分层分层RR、AR、AR%、PAR、PAR% 分级分级RR、AR、AR%、PAR、PAR 图图图图4. 4. 4. 4. 队列研究数据的分析程序队列研究数据的分析程序队列研究数据的分析程序队列研究数据的分析程序 五更楔寄剖活八某藉憨才肇贝恶憾忿掺磁鉴汹蹋室置丘甲提秩好熊遮运淳流行病学数据分析处理方法流行病学数据分析处理方法30山东大学公共卫生学院山东大学公共卫生学院 三、实验研究的数据分析方法三、实验研究的数据分析方法三、实验研究的数据分析方法三、实验研究的数据分析方法干预组与对照组某疾病发病率、危险因素的干预组与对照组某疾

37、病发病率、危险因素的干预组与对照组某疾病发病率、危险因素的干预组与对照组某疾病发病率、危险因素的暴露率及数值变量均值水平的差异,检验方暴露率及数值变量均值水平的差异,检验方暴露率及数值变量均值水平的差异,检验方暴露率及数值变量均值水平的差异,检验方法同前述法同前述法同前述法同前述效果指数、保护率效果指数、保护率效果指数、保护率效果指数、保护率狠苇疆尤者郡颓冗衫漆判塑涉轻俺斯岳嚎人陌碳渭钡善肮自匀乡窄觅撇梨流行病学数据分析处理方法流行病学数据分析处理方法31山东大学公共卫生学院山东大学公共卫生学院流行病学数据的表达与报告流行病学数据的表达与报告一、数据的报告顺序一、数据的报告顺序1、按分析顺序、

38、按分析顺序描述性结果:如人口学数据(性别、年龄、职业、文化程度,描述性结果:如人口学数据(性别、年龄、职业、文化程度,居住地)、某病发病率居住地)、某病发病率/ /患病率、危险因素流行率、数值变患病率、危险因素流行率、数值变量的集中趋势及变异情况量的集中趋势及变异情况单因素分析结果单因素分析结果多因素的分析结果多因素的分析结果2、按变量的特点及逻辑顺序、按变量的特点及逻辑顺序按某疾病的人群、地区及时间的分布特征按某疾病的人群、地区及时间的分布特征按个人生活方式因素、家族遗传因素、社会心理因素、实验按个人生活方式因素、家族遗传因素、社会心理因素、实验室及体格检查结果等顺序室及体格检查结果等顺序脂

39、雌导脖雅锥纹侨床随斧拘叛客瞩妊尧谨炊轰缝脱猎籽浓妹泥硼乌役载给流行病学数据分析处理方法流行病学数据分析处理方法32山东大学公共卫生学院山东大学公共卫生学院 二、非正态数据的表达与报告二、非正态数据的表达与报告1 1、未进行变量转换:、未进行变量转换:报告中位数、最小值及最大值报告中位数、最小值及最大值报告中位数、报告中位数、25%25%分位数、分位数、75%75%分位数、最小值及分位数、最小值及最大值最大值报告均值、中位数再配合以上的变异指标报告均值、中位数再配合以上的变异指标2 2、进行变量转换数据、进行变量转换数据报告原始值报告原始值报告其转换值报告其转换值贤炬侧俭整牌撅猖娘阵婪俺梦段枯匈

40、琼望饭灭乌猎惮螟篷厂闪旁掳关蓬幕流行病学数据分析处理方法流行病学数据分析处理方法33山东大学公共卫生学院山东大学公共卫生学院 三、数据表达与报告中图、表及文字的使用三、数据表达与报告中图、表及文字的使用u合理合理u生动活泼、简洁明了生动活泼、简洁明了u协调好三者关系协调好三者关系如用盒状图(均值、如用盒状图(均值、25%25%分位数、分位数、75%75%分位数、最小值及最分位数、最小值及最大值)表达数据的集中趋势及变异情况大值)表达数据的集中趋势及变异情况以表格的形式报告以表格的形式报告OROR值或值或RRRR值值以条图的形式报告以条图的形式报告OROR或或RRRR的点估计值、的点估计值、95

41、%95%或或99%99%可信区间可信区间爹性传泄京措纤裁状昭喷侄徊芒棒鉴窗啦鉴惺憋陶规微大墙育推渍瑚入雇流行病学数据分析处理方法流行病学数据分析处理方法34山东大学公共卫生学院山东大学公共卫生学院流行病学数据分析中存在的问题流行病学数据分析中存在的问题流行病学数据分析中存在的问题流行病学数据分析中存在的问题一、不重视人口学数据及描述性统计量分析一、不重视人口学数据及描述性统计量分析一、不重视人口学数据及描述性统计量分析一、不重视人口学数据及描述性统计量分析二、忽视分析方法的应用条件二、忽视分析方法的应用条件二、忽视分析方法的应用条件二、忽视分析方法的应用条件三、数据的分组方法不合理三、数据的分

42、组方法不合理三、数据的分组方法不合理三、数据的分组方法不合理四、多因素分析中分类变量未转换为哑变量四、多因素分析中分类变量未转换为哑变量四、多因素分析中分类变量未转换为哑变量四、多因素分析中分类变量未转换为哑变量五、多因素分析中未进行模型拟合度的检验五、多因素分析中未进行模型拟合度的检验五、多因素分析中未进行模型拟合度的检验五、多因素分析中未进行模型拟合度的检验六、需要分析的数据未进行统计学分析六、需要分析的数据未进行统计学分析六、需要分析的数据未进行统计学分析六、需要分析的数据未进行统计学分析七、缺失数据的处理七、缺失数据的处理七、缺失数据的处理七、缺失数据的处理八、相对数的误用八、相对数的误用八、相对数的误用八、相对数的误用九、忽视对协变量效应的控制九、忽视对协变量效应的控制九、忽视对协变量效应的控制九、忽视对协变量效应的控制伪塑斌钵佬落逼滓廖援虎爆立镐述迅欠惜铂值幸耘蘑咀倾矛营惰嫡福柿老流行病学数据分析处理方法流行病学数据分析处理方法35

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号