医学研究数据管理与分析

上传人:第*** 文档编号:56451752 上传时间:2018-10-12 格式:PPT 页数:246 大小:7.39MB
返回 下载 相关 举报
医学研究数据管理与分析_第1页
第1页 / 共246页
医学研究数据管理与分析_第2页
第2页 / 共246页
医学研究数据管理与分析_第3页
第3页 / 共246页
医学研究数据管理与分析_第4页
第4页 / 共246页
医学研究数据管理与分析_第5页
第5页 / 共246页
点击查看更多>>
资源描述

《医学研究数据管理与分析》由会员分享,可在线阅读,更多相关《医学研究数据管理与分析(246页珍藏版)》请在金锄头文库上搜索。

1、1,Email: 13813894748,南京医科大学公共卫生学院 流行病学系,沈冲,医学研究的数据管理与分析,2,数据,决策,3,The basic purpose of epidemiology is to help us understand and prevent a wide variety of health and safety problems. For example, as a result of epidemiological studies, we instituted a number of prevention and intervention programs

2、that helped lower the rate of deaths from lung cancer. (And epidemiologists statistically showed that these programs had an effect on lowering the death rate.),4,5,伦敦霍乱死亡者居住地点分布,6,正态分布,7,偏态分布,8,n =140,n =140,n =140,总体估计,9,了解抽样误差规律的重要性,总体 同质个体、个体变异,总体参数 未知,样本 代表性、抽样误差,随机 抽样,样本统计量已知,统计推断,风 险,10,正常人,病人

3、,假阳性率,假阴性率,正常人与病人的数据分布重叠示意图(单侧),11,正常人,病人,假阳性率,假阴性率,正常人与病人的数据分布重叠示意图(单侧),12,正常人,病人,假阳性率,假阴性率,病人,正常人与病人的数据分布重叠示意图(双侧),13,红细胞计数(RBC)参考值范围,成年男性:4.05.5 (1012/L) 成年女性:3.55.0 (1012/L) 新 生 儿:6.07.0 (1012/L),14,白细胞计数参考值范围,成年: 4.010.0 (109/L) 新生儿: 15.020.0 (109/L) 6个月2岁: 11.012.0 (109/L),15,医院血常规正常值范围,16,医院生

4、化检验参考值范围,17,参考值范围的特点,与种族有关 与年龄、性别有关 与环境、气候有关 与仪器本身有关 不同的医院,参考值范围不同,18,第一部分,数据管理与分析概述,19,一、调查研究设计思路与统计分析步骤的关系,搜集资料,整理与分析资料,调查(研究)项目,分析表(指标),研究目的,统计分析步骤,调查研究步骤,设计思路,exposure,(factor),Disease or health,第一节 研究设计与数据的管理及分析,20,二、调查研究计划的制订和数据管理分析,(一)明确调查和研究的目的 了解参数,用以说明总体。描述分布,确定生理、生化等正常值; 研究变量间的关系,通过确立统计学联

5、系来验证因果联系(包括干预处理与效应的关系)。(二)确定观察对象和观察单位 根据调查和研究的目的和指标,确定观察对象和观察单位,21,(三)调查和研究设计类型的选择,主要取决于研究目的和客观条件的限制。 1调查和研究设计的常用类型 (1)描述性研究:包括普查、抽样调查和案例调查、病例分析等 (2)分析性研究:包括病例对照研究、队列研究。 (3)实验性研究:包括临床试验、现场实验和社区干预等。 2实验设计类型,22,(四)确定调查研究项目和调查表 1调查和研究的项目 包括分析项目、备选项目。 2调查表和原始记录表的设计(五)样本含量的估计 样本含量大小主要取决于研究单位的变异大小、两组或多组可能

6、差异的大小、精确性的要求、第一类错误和第二类错误的设定。不同研究设计可用各自样本含量计算公式来估计。一般实际样本大于理论样本。 Epi Info、EpiCalc、ps等。 Power and sample size 正交设计助手,23,样本含量估计1(EpiCalc2000),24,样本含量估计2(EpiCalc2000),25,样本含量估计3(EpiCalc2000),26,27,临床研究,患者为对象 序贯法 变异 疗效 Power(1-) 动物为对象 应用推广 风险评估 随访,28,(六)收集原始资料的方式和数据的类型,原始资料的收集方式 直接观察法:包括体检、标本检测等。 采访法:面访、

7、调查会及信访、电话访问等 医学研究的数据类型医学研究数据大体上可分为三种类型:定量数据、等级数据和名义数据。 定量数据: 等级数据: 名义数据:等级数据和名义数据也称定性数据或计数资料。,血糖不同数据类型的分析方法,29,定量数据:空腹血糖(mmol/L) 等级数据: 专业分组:空腹血糖受损糖尿病 统计学分组: 百分位数 参考值范围,血糖分析注意事项,研究对象 影响因素 分布及定量资料分析 是否分组的考虑 分组的方法,30,思考题,血压研究 研究对象 影响因素 分布及定量资料分析 是否分组的考虑 分组的方法,31,32,(七)调查和研究的质量控制,质量控制是决定医学研究结果真实性和可靠性的关键

8、。 归纳、比较、推理与科学性 系统误差(systematic error),即偏倚(bias),包括选择性偏倚、信息偏倚和混杂偏倚三类。 医学研究的质量控制即是控制这三类偏倚。,33,(八)数据资料的录入与整理,录入前的检查、核对、录入的质量控制资料录入,建立database录入后的核对、分组、编码等。,34,数据录入,录入计算机,建立数据库(database) 可以通过统计分析软件和数据库软件录入。常用的软件有: Epi Info、EpiData、 SPSS、 FoxBase、FoxPro、Visual FoxPro(VFP)、 Access、Excel和Lotus等。 推荐应用EpiDat

9、a软件录入数据。,35,Epidata3.0,36,录入后处理,逻辑核对:数据的编码和转换:建立新变量,37,研究数据处理过程,Data,Epidata,SPSS,Questionnaire,File(*.qes),File(*.rec),File(*.sav),File(*.dat),File(*.dbf),Foxpro,vfp,excell,Epicalculator,sample,analysis,38,三、数据分析,统计描述,统计推断,1定量数据的描述,(1)集中和离散趋势,(2)正常值范围和总体可信区间的估计,2定性数据的统计描述:各种相对指标: 率和比,如发病率、病死率、罹患率、二

10、代发病率、平均抗体滴度、保护率、效果指数、标化死亡比等。,1假设检验,(1)定量数据 t 检验 方差分析(ANOVA):(2)定性数据 X2检验、U检验,2变量之间的关系分析,(1)相关分析 (2)回归分析 (3)定性数据之间得关系分析,数学模型,Reed-Frost模型,39,定量数据统计描述方法小结,40,定性数据统计描述方法小结,41,(二)统计推断 1、 假设检验 定量数据t检验:样本均数与总体均数比较 配对设计资料均数比较 成组设计两样本均数比较方差分析(ANOVA):成组设计多个样本均数的比较(one-way ANOVA)配伍组设计多个样本均数比较(two-way ANOVA)多个

11、样本均数的两两比较(q检验,Student-Newman-Keuls法) 多个实验组和一个对照组均数间的两两比较(LSD法和Duncan法),42,定量数据差别的统计意义检验小结,43,第二节 医学研究的数据 管理和分析应遵循的原则,一、重视研究数据资料的处理过程 保证被分析数据的正确性,和获得的客观结果尽可能保持一致,控制信息偏倚; 使原始数据经过编码、转换、重新赋值后符合进一步统计分析的需要。 二、选择合适的统计分析方法和指标 取决于数据及其分布得类型(一)数据转换 (二)正态性检验 (三)非参数统计法 (四)分析指标的选择,44,45,46,三、忠实于原始数据是必须具备的科学精神,医学研

12、究的结果和客观现实之间,总会存在或多或少的不一致(即误差,error) 随机误差 系统误差 医学研究过程中,应尽量通过科学的设计和严格的质量控制措施,控制系统误差。任何篡改研究数据的行为,不管出自什么目的,都违背科学精神。,47,第三节 不同研究设计类型的统计分析方法和指标选择,一、病例报告/个案调查 二、病例对照研究 三、随访研究,48,一、抽样调查,(一)分析思路和指标 描述抽样方法,设计样本量、调查样本量、应答率等。 计算有关统计指标 描述疾病或健康状态的分布 分析性描述 结果解释与注意事项,49,抽样调查结果与结论及其解释,结果解释 一般先说明样本的代表性、应答率等情况, 分析调查中有

13、无偏倚及其来源、大小、方向和调整方法, 归纳疾病或健康状态分布规律的正确性及可能提供的病因线索。 注意事项 现况研究资料分析结果的价值,取决于资料质量的优劣和分组、归纳方法是否恰当,尤其是偏倚的影响至关重要。 在和其它地区进行疾病频率比较时,必须考虑到年龄等非研究因素的影响,需将疾病频率按标准人口构成标准化后才具有可比性。,50,第四节 医学研究数据分析结果的解释,1遵循科学的思维逻辑 2了解不同研究设计的效率 3遵循概率论的基本原则 4树立对比的观点 5深刻理解统计学联系的本质,一、数据分析结果解释应遵循的原则,51,二、统计学联系的本质, 真实的联系 机遇(chance) 偏倚(bias)

14、,三、解释的思路, 统计学 逻辑学 生物医学,52,第五节 质量控制,设计前 设计 预试验/调查 实施/实验 数据录入,数据核查、整理 合适的统计方法 合理表达结果 结果解释 结论,53,质量控制1数据录入,软件选择高效、准确、易学 准确 双份录入 范围设定 必须输入 有效性检查 高效跳转、重复、标签 数据便于管理与转换,54,质量控制2数据核查、整理,核查 排序 缺失处理 逻辑校对,整理 合并 转换 重新编码 加权 产生新指标,55,质量控制3统计分析方法,56,质量控制4合理表达结果,结果不是结论 一般描述 指标 检验统计量与P值 统计表 统计图,57,质量控制5结果解释与评价,研究范围

15、结果准确性 结果可靠性 有无其它原因可以解释 影响结果的因素,58,质量控制6结论,严谨 客观性、合理性 可应用性 局限性,59,第二部分,数据管理和统计分析的实现过程,60,第一章 随机化与样本含量计算,61,随机化过程 随机抽样 随机分组 样本量的估算 研究功效的估算,62,EpiCalcSampleRandom numbersList,随机抽样,63,EpiCalc 2000,64,EpiCalc 2000,65,66,SPSS DataSelect cases Random sample of cases留意种子数,67,简单随机分组,68,EpiCalc 2000,69,EpiCal

16、c 2000,70,估计样本量的意义 过小: 抽样误差大、代表性差、不易得出有意义的结果 过大: 不必要的浪费,71,预期的现患率: 越高,所需样本量越小 对调查结果精确性的要求: 允许误差越大,所需样本量越小,现况研究,影响样本含量的因素,72,某卫生防疫站拟调查了解该地成人白细胞数是否偏低,若用抽样调查,样本含量至少应有多少人?据文献报道,正常成人白细胞数的标准差约1000个/mm3,规定容许误差为100个/mm3。,现况研究,EpiCalcSamplePrecisionSingle mean,1. 计量资料,73,EpiCalc 2000,74,EpiCalc 2000,75,某卫生防疫站为了制订驱蛔虫计划,编制经费、药品预算,需要抽样估计当地儿童蛔虫感染率。据该地以往经验,儿童蛔虫感染率一般不高于30%,若规定容许误差为3%,则样本含量至少应为多少人?,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 医学现状与发展

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号