流行病学数据分析前准备工作.ppt

上传人:s9****2 文档编号:568698862 上传时间:2024-07-26 格式:PPT 页数:13 大小:244.81KB
返回 下载 相关 举报
流行病学数据分析前准备工作.ppt_第1页
第1页 / 共13页
流行病学数据分析前准备工作.ppt_第2页
第2页 / 共13页
流行病学数据分析前准备工作.ppt_第3页
第3页 / 共13页
流行病学数据分析前准备工作.ppt_第4页
第4页 / 共13页
流行病学数据分析前准备工作.ppt_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《流行病学数据分析前准备工作.ppt》由会员分享,可在线阅读,更多相关《流行病学数据分析前准备工作.ppt(13页珍藏版)》请在金锄头文库上搜索。

1、流行病学数据分析前的准备工作 一、原始数据的检查一、原始数据的检查 在数据分析前需要对原始的流行病学调查研究数据进行一次在数据分析前需要对原始的流行病学调查研究数据进行一次审查审查,发现可能存在的错误、遗漏的研究变量取值和其他问题,并发现可能存在的错误、遗漏的研究变量取值和其他问题,并采取相应采取相应的措施进行处理的措施进行处理。 例如:例如: 若在调查表中发现有若在调查表中发现有缺失的数据缺失的数据,可以通过电话再次询问研究对,可以通过电话再次询问研究对象、查阅有关的记录、应用储存的血液标本重新检测或再次取样等措象、查阅有关的记录、应用储存的血液标本重新检测或再次取样等措施进行补充。施进行补

2、充。 若发现若发现逻辑错误逻辑错误,也要及时改正。需要对调查问卷进行编码或者,也要及时改正。需要对调查问卷进行编码或者对已编码的问卷进行核查,避免重复和遗漏。对已编码的问卷进行核查,避免重复和遗漏。 二、选择合适的数据管理和数据分析软件二、选择合适的数据管理和数据分析软件常用的数据管理软件常用的数据管理软件 Microsoft FoxPro、Microsoft Access、Microsoft Excel 这些数据管理软件也具有简单的数据分析功能,这些数据管理软件也具有简单的数据分析功能,Excel的数据分析功能更强,不仅可实现描述性统计,还的数据分析功能更强,不仅可实现描述性统计,还可以做可

3、以做t检验、方差分析、相关回归分析等。检验、方差分析、相关回归分析等。数据分析软件数据分析软件 SAS(Statistical Analysis System)和和SPSS(Statistical Package for Social Science),它,它们均具有很强的数据分析和数据们均具有很强的数据分析和数据管理的功能。管理的功能。 三、数据的计算机录入三、数据的计算机录入 ( (编号、定义变量名、变量数量化)编号、定义变量名、变量数量化)u编号:给编号:给每一个每一个调查表或调查对象调查表或调查对象一个一个编编号以识别录入的数据与调查表或调查对象号以识别录入的数据与调查表或调查对象的对

4、应关系的对应关系(唯一性)(唯一性)p使用阿拉伯数字使用阿拉伯数字1 1、2 2、33等给每份调查表按等给每份调查表按照顺序编号,这样有利于以后对输入的数据进照顺序编号,这样有利于以后对输入的数据进行检查、核对与修改错误。行检查、核对与修改错误。p可以给编号以时间、地区、单位、调查对象编可以给编号以时间、地区、单位、调查对象编号等,号等,u定义变量名称:定义变量名称:命名:可以应用中文、拼音、也可以应用英文,但以使用命名:可以应用中文、拼音、也可以应用英文,但以使用拼音或英文为好,这样可以方便输入。拼音或英文为好,这样可以方便输入。注意:注意:p变量名应简短、易懂易记变量名应简短、易懂易记。p

5、标记或说明:有些数据管理和分析软件可变量进行标记或说明,标记或说明:有些数据管理和分析软件可变量进行标记或说明,避免时间长久了而忘记数据库中的变量名字,。避免时间长久了而忘记数据库中的变量名字,。 u变量数量化变量数量化 如果调查表的设计是编码式的,则此步骤可省如果调查表的设计是编码式的,则此步骤可省略,直接将变量取值编码的结果输入计算机。略,直接将变量取值编码的结果输入计算机。 若不是编码式的调查结果,则需要对变量的取若不是编码式的调查结果,则需要对变量的取值结果进行编码。值结果进行编码。 常见变量的类型常见变量的类型 1 1、字符型、字符型(character type)(characte

6、r type): 输入字符如中文或英文输入字符如中文或英文 2 2、数值型、数值型(numerical type)(numerical type): 以数值的形式输入以数值的形式输入 3 3、日期型、日期型(data type)(data type): 按照规定的格式输入日期数值按照规定的格式输入日期数值 4 4、逻辑性(、逻辑性(logical typelogical type): : 变量数量化时应注意:变量数量化时应注意: (1)除日期型变量外尽量使用数值型变量)除日期型变量外尽量使用数值型变量 (2)某些数值变量)某些数值变量(numerical variable)可直接输入变量的取值

7、,如研究对象的身可直接输入变量的取值,如研究对象的身高、体重、血压水平等。高、体重、血压水平等。 (3)分类变量分类变量(categorical variable)及及有有 序变量序变量(ordinal variable)则可将其取值则可将其取值进行进行量化量化,然后再输入计算机。,然后再输入计算机。 四、数据的检查与核对四、数据的检查与核对四、数据的检查与核对四、数据的检查与核对 (一)检查数据库结构(一)检查数据库结构(一)检查数据库结构(一)检查数据库结构 数据库样本数(观测数)、变量数、变量名称及定义等。数据库样本数(观测数)、变量数、变量名称及定义等。数据库样本数(观测数)、变量数、

8、变量名称及定义等。数据库样本数(观测数)、变量数、变量名称及定义等。(二)检查各变量的取值情况(二)检查各变量的取值情况(二)检查各变量的取值情况(二)检查各变量的取值情况 查看变量取值范围,有无逻辑错误:查看变量取值范围,有无逻辑错误:查看变量取值范围,有无逻辑错误:查看变量取值范围,有无逻辑错误:如性别如性别如性别如性别应有两个取值,应有两个取值,应有两个取值,应有两个取值,若有若有若有若有2 2个以上的取值,说明存在错误个以上的取值,说明存在错误个以上的取值,说明存在错误个以上的取值,说明存在错误 。 对数据变量要检查其最小值对数据变量要检查其最小值对数据变量要检查其最小值对数据变量要检

9、查其最小值(minimum)(minimum)、最大值、最大值、最大值、最大值(maximum)(maximum)、均数、均数、均数、均数(mean)(mean)、中位数、中位数、中位数、中位数(median)(median),并查看是,并查看是,并查看是,并查看是否有异常取值否有异常取值否有异常取值否有异常取值(outlier)(outlier),如极小值及极大值。,如极小值及极大值。,如极小值及极大值。,如极小值及极大值。 异常值若影响显著时应删除异常值若影响显著时应删除异常值若影响显著时应删除异常值若影响显著时应删除五、数据的整理五、数据的整理(一)数据分组(一)数据分组分类变量:分类变

10、量: 按其原有的分类进行分组,若有必要,可将按其原有的分类进行分组,若有必要,可将性质相近或差别不大的类别进行合并。如教育程度。性质相近或差别不大的类别进行合并。如教育程度。数值变量:数值变量: 按照按照实际的生理、病理或临床意义分组实际的生理、病理或临床意义分组,如体重指数:,如体重指数:低体重、正常体重、超重和肥胖低体重、正常体重、超重和肥胖 (二)数据的转换二)数据的转换1、非正态数据的变量转换、非正态数据的变量转换原理:原理: 正态分布正态分布 参数检验参数检验(parametric test) 非正态数据非正态数据非参数检验非参数检验(non-parametric test) (不是

11、对原始数据检验)如:秩和检验(不是对原始数据检验)如:秩和检验 (是对原始(是对原始数据的秩次检验)数据的秩次检验)检验:正态性检验、方差齐性检验检验:正态性检验、方差齐性检验 方法:对数变换;平方根变换;倒数变换方法:对数变换;平方根变换;倒数变换 六、确定拟分析的因变量和应变量六、确定拟分析的因变量和应变量因(自)变量因(自)变量(dependent variable):是指是指影响疾病的发生或健康状况的分布的变量,影响疾病的发生或健康状况的分布的变量,是原因变量是原因变量 、已知变量、已知变量、x变量。变量。应变量应变量(independent variable):是指随因是指随因变量的

12、变化而发生变化的变量,是结果变变量的变化而发生变化的变量,是结果变量、预测变量、量、预测变量、y变量。变量。 应变量是在自变量作用下产生反应的变量应变量是在自变量作用下产生反应的变量七、缺失数据(七、缺失数据(missing data)的处理)的处理 缺失数据:是指其测量结果缺失。缺失数据:是指其测量结果缺失。 产生的原因:产生的原因:p问卷调查:遗漏出生日期和年龄,调查结束后又无法补救问卷调查:遗漏出生日期和年龄,调查结束后又无法补救p实验室检测:血脂或血糖因为血清量不足或研究对象拒绝采血而实验室检测:血脂或血糖因为血清量不足或研究对象拒绝采血而致致p过去处理:仅用无缺失的数据进行分析过去处理:仅用无缺失的数据进行分析损失样本量损失样本量 缺失数据缺失数据“合理合理”赋值赋值人为赋人为赋值不一定合理值不一定合理

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号