数据处理的一般原则与方法

上传人:宝路 文档编号:48240173 上传时间:2018-07-12 格式:PPT 页数:58 大小:810.93KB
返回 下载 相关 举报
数据处理的一般原则与方法_第1页
第1页 / 共58页
数据处理的一般原则与方法_第2页
第2页 / 共58页
数据处理的一般原则与方法_第3页
第3页 / 共58页
数据处理的一般原则与方法_第4页
第4页 / 共58页
数据处理的一般原则与方法_第5页
第5页 / 共58页
点击查看更多>>
资源描述

《数据处理的一般原则与方法》由会员分享,可在线阅读,更多相关《数据处理的一般原则与方法(58页珍藏版)》请在金锄头文库上搜索。

1、数据处理的数据处理的 一般原则与方法一般原则与方法第第2929章章第二军医大学卫生统计学教研室张罗漫1讲课内容:讲课内容:第一节第一节 医学统计学概述医学统计学概述( (重点重点) )第二节第二节 原始数据的录入原始数据的录入第三节第三节 数据处理的几个基本问题数据处理的几个基本问题第四节第四节 统计方法选择的基本思路统计方法选择的基本思路( (重点重点) )2第一节第一节医学统计学概述医学统计学概述3医学统医学统 计计 学学研究 设计数据 处理观察性研究实验性研究统计描述统计推论 假设检验参数估计(调查)4调查设计调查设计调查方法调查对象调查指标研究目的按范围按时间抽样普查横向(现况调查)非

2、概率概 率简单随机 系统分层随机整群纵向 病例对照研究队列研究调查工具调查员 5实验设计实验设计实验分类动物实验 临床试验社区干预试验基本要素处理因素 受试对象实验效应6实验设计实验设计随机化基本原则对 照重 复 (样本含量)设置原则:均衡可比类型:配对、组间 1- 、 空白 实验 安慰剂 标准 相互7统计描述统计描述统计表制表原则制表要求简单明了主语在左、宾语在右一张表表达一个中心内容备注数字线条标目标题8统计描述统计描述统计图制图原则制图要求连续性资料:间断性资料:图例刻度纵轴、横轴标目标题条图、圆图、百分比条图线图、直方图、散点图9统计描述统计描述统计 指标计量资料 (单变量)中心 位置

3、正态:非正态:对数正态:离散程度个体值样本均数:正态非正态:量纲相同:量纲不同:计量资料 (双变量)离散程度:r、b10统计描述统计描述中心位置:均数向量离散程度:离均差矩阵协方差矩阵相互关系:相关矩阵计量资料(多变量)统计 指标11统计描述统计描述等级 资料统计 指标计数资料绝对数、率、构成比 、相对比 、RR(OR) 离散程度:标准误离散程度:秩号、秩和 秩和的标准误单变量双变量:rs12统计描述统计描述参 考 值 范围估计正态偏态或双侧:单侧:双侧:单侧:或13统计推论统计推论参数 估计区间 估计点估计双侧:单侧:或 双侧:单侧:或RR(OR):14统计推论统计推论假设 检验 步骤1.进

4、行检验假设假设样本来自某一特定总体 2.确定检验水准确定最大允许误差 3.选定检验方法计算检验统计量计算样本与总体的偏离程度 4.根据一特定分布计算与检验统计量对应的P值 5.作出结论根据小概率反证法思想作出推断15统计推论统计推论比较差别:2、t、u、F、q、log-rank、 秩和检验等 联系:相关、回归分析 分类:聚类、回归分析 鉴别:判别分析 推测:回归分析 筛选影响因素:回归分析 综合变量信息:主成分分析 寻找潜在支配因素:因子分析假设 检验 方法16第二节原始数据的录入17一、原始数据的记录形式一、原始数据的记录形式行:观察单位 列:变量18标识变量分析变量19标识变量分析变量解释

5、变量反应变量20二、原始数据的录入二、原始数据的录入文件类型: 数据库文件:EpitaDadBASE、FoxBASE、FoxprowOracle Excel文件: Excel 文本文件:Word 统计软件数据文件:SPSS、SAS、STATA 变量名的定义: 变量值的量化: 21第三节第三节数据处理数据处理 的几个基本问题的几个基本问题22一、数据的净化一、数据的净化逻辑检查计算检查 二、离群数据的处理二、离群数据的处理离群值(outliner) 与P25或P75的距离为 “四分位数间距”的1.53.0倍。极端值(extreme value) 与P25或P75的距 离为“四分位数间距”的3.0

6、倍以上。剔除离群或极端值要予以合理解释。23三、统计方法前提条件的检验三、统计方法前提条件的检验多样本比较的方差分析:独立正态分布方差齐性多重线性回归分析:变量间无多重共线残差分布正态 24第四节第四节统计方法选择统计方法选择 的基本思路的基本思路25根据:根据:医学专业知识医学统计学知识计算机统计软件技术26设计类型:完全随机、随机区组、拉丁方、交叉、析因、正交、嵌套、裂区设计 处理因素:单因素、双因素、多因素 反应变量:单变量、双变量、多变量 资料类型:计量、无序分类、有序分类 样本数目:单样本、两样本、多样本 数据提供信息:完全数据、不完全数据、重复测量数据 假设检验方法前提条件:独立、

7、方差齐性、正态分布重要27一、单变量计量资料一、单变量计量资料1.样本均数与总体均数比较单因素 服从正态分布单样本t检验可信区间法不服从正态分布单个样本中位数与总体中位数比较282.两个相关样本均数的比较单因素配对设计或自身前后对照设计 差值服从正态分布成对t检验可信区间法差值不服从正态分布Wilcoxon符号秩检验一、单变量计量资料一、单变量计量资料1-可信区间不 包括 d=0,P T 1 Pearson 2 检验(Yates 校正公式) N40 或 T 1 Fisher 确切概率法(2)配对设计 McNemar 2 检验Logistic回归分析39Y(疗效) =1 有效0 无效X1(试验因

8、素) =1 有0 无组别 疗效 频数1 1 991 2 52 1 752 2 21数据输 入格式403.RC列联表 相关、相差(1)双向有序 备择假设:行变量与列变量为非零相关 Cochran-Mantel-Haenszel 2 检验 有序分组资料的线性趋势检验 2 回归(2)单向(反应变量)有序 备择假设:行平均得分不同 Cochran-Mantel-Haenszel 2 检验 Wilcoxon 秩和检验二、计数资料二、计数资料413.RC列联表 相关、相差(3)双向无序 备择假设:行变量与列变量有一般关联 Cochran-Mantel-Haenszel 2 检验 Pearson 2 检验二

9、、计数资料二、计数资料421.配对设计Wilcoxon符号秩检验2.两组独立样本Wilcoxon两样本秩和检验3.完全随机设计多个样本比较Kruskal-Wallis H 检验 4.随机区组设计多个样本比较Friedman M 检验三、等级资料三、等级资料431.相关分析X1与X2服从二元正态分布Pearson积差相关分析X1与X2不服从二元正态分布Spearman秩相关分析 2.回归分析Y与X服从二元正态分布或 Y服从正态分布而X为控制变量Y与X间呈直线趋势直线回归分析四、双变量资料四、双变量资料443.曲线回归分析(SPSS)453.曲线回归分析(SPSS)464. 协方差分析 比较带有协

10、变量(Xj)的各组均数( )间的差别 协变量Xj对Yj有影响 分为完全随机设计与随机区组设计471.有应变量的多元分析五、多变量资料五、多变量资料481.有应变量的多元分析Y为计量资料且服从正态分布自变量服从多元正态分布多元线性回归或多元逐步回归分析五、多变量资料五、多变量资料491.有应变量的多元分析Y为判别分类变量自变量服从多元正态分布判别分析或逐步判别分析五、多变量资料五、多变量资料501.有应变量的多元分析Y为二分类或多分类变量以分析危险因素为主要目的条件或非条件Logistic回归分析五、多变量资料五、多变量资料511.有应变量的多元分析Y为生存时间且含有截尾数据Cox比例风险回归分

11、析五、多变量资料五、多变量资料522.无应变量的多元分析五、多变量资料五、多变量资料532.无应变量的多元分析将n个观察单位聚为k类(n k)Q型聚类将m个变量聚为k类(m k)R型聚类 五、多变量资料五、多变量资料542.无应变量的多元分析将所有变量化为少数几个互不相关的综合变量主成分分析从所有变量中找出有限个不可观测的潜在因素因子分析 五、多变量资料五、多变量资料552.无应变量的多元分析分析一个变量与一组变量的相关关系多元线性相关分析分析一组变量与另一组变量的相关关系典型相关分析五、多变量资料五、多变量资料56讲课内容:讲课内容:第一节第一节 医学统计学概述医学统计学概述( (重点重点) )第二节第二节 原始数据的录入原始数据的录入第三节第三节 数据处理的几个基本问题数据处理的几个基本问题第四节第四节 统计方法选择的基本思路统计方法选择的基本思路( (重点重点) )57Thank you!Thank you!58

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号