统计方法选择与结果解释教材

上传人:我** 文档编号:116129231 上传时间:2019-11-15 格式:PPT 页数:87 大小:820.50KB
返回 下载 相关 举报
统计方法选择与结果解释教材_第1页
第1页 / 共87页
统计方法选择与结果解释教材_第2页
第2页 / 共87页
统计方法选择与结果解释教材_第3页
第3页 / 共87页
统计方法选择与结果解释教材_第4页
第4页 / 共87页
统计方法选择与结果解释教材_第5页
第5页 / 共87页
点击查看更多>>
资源描述

《统计方法选择与结果解释教材》由会员分享,可在线阅读,更多相关《统计方法选择与结果解释教材(87页珍藏版)》请在金锄头文库上搜索。

1、统计方法选择与结果解释统计方法选择与结果解释 刘元元刘元元 2010.6.122010.6.12 医 学 统 计 学(第二版) 李晓松 第一节第一节 统计方法的正确选择统计方法的正确选择 医 学 统 计 学(第二版) 李晓松 一、统计方法选择的基本思路一、统计方法选择的基本思路 二、统计分析需注意的若干问题二、统计分析需注意的若干问题 医 学 统 计 学(第二版) 李晓松 数据特征数据特征 样本含量样本含量 研究目的研究目的 对比组数对比组数 设计类型设计类型 资料类型资料类型 综合判断综合判断 医 学 统 计 学(第二版) 李晓松 1. 1. 研究目的研究目的 uu一是通过一是通过比较比较,

2、 ,回答回答观测指标的差别是否归观测指标的差别是否归 因于处理因素或分组因素因于处理因素或分组因素,在本教材范围内所涉,在本教材范围内所涉 及的主要是单变量问题。及的主要是单变量问题。 uu二是分析二是分析变量之间是否存在某种联系变量之间是否存在某种联系,这主,这主 要涉及相关分析和回归分析,在本教材范围内所要涉及相关分析和回归分析,在本教材范围内所 涉及的主要是双变量问题。涉及的主要是双变量问题。 表表1. 1. 两种方法检测两种方法检测1212名妇女最大呼气率名妇女最大呼气率(L/min)(L/min)结果结果 医 学 统 计 学(第二版) 李晓松 组别组别有效有效无效无效合计合计 甲药甲

3、药27 2718184545 乙药乙药40 40 5 5 4545 合计合计676723239090 表2. 甲、乙两药治疗小儿上消化道出血的效果 医 学 统 计 学(第二版) 李晓松 2. 2. 设计类型设计类型 从实验研究设计来看,常见的设计类型为 完全随机设计完全随机设计( (成组设计成组设计) ) 配对或配伍设计配对或配伍设计( (随机区组随机区组 设计设计) ) 医 学 统 计 学(第二版) 李晓松 两样本两样本( (成组成组) )t t 检验检验 单因素单因素( (完全随机设计完全随机设计) )方差分析方差分析 卡方检验卡方检验( (独立样本独立样本) ) 两样本两样本Wilcox

4、onWilcoxon秩和检验或多样本秩和检验或多样本 KruskalKruskal-Wallis-Wallis秩和检验秩和检验 对完全随机设计的数据,应选择相应的方法: 医 学 统 计 学(第二版) 李晓松 配对配对t t检验检验 配伍组配伍组( (随机区组随机区组) )设计方差分析设计方差分析 配对卡方检验配对卡方检验 配对配对( (符号秩和检验符号秩和检验) )或配伍设计的秩和检验或配伍设计的秩和检验 ( (FriedmanFriedman秩和检验秩和检验) )等。等。 对于配对或配伍设计的数据,应选择相应的方法: 医 学 统 计 学(第二版) 李晓松 3. 3. 资料类型资料类型 v对于

5、定量变量,选择它所对应的统计方法? v对于定性变量,选择它所对应的统计方法? 医 学 统 计 学(第二版) 李晓松 4. 4. 数据特征数据特征 对于同一设计类型和同一资料类型,仍 然有许多方法可以选择。 医 学 统 计 学(第二版) 李晓松 表表3. 3. 九九个测定点用甲、乙两种方法的测定结果个测定点用甲、乙两种方法的测定结果(g/m(g/m 3 3) ) 医 学 统 计 学(第二版) 李晓松 t检验和方差分析属参数检验方法,对数据要求较 高,通常要求数据服从正态分布和方差齐性。 如果服从该条件或经变量变换后服从条件,则采 用参数检验方法,否则采用秩和检验这类非参数 检验方法。 能否不考虑

6、分布和方差齐性问题,直接采用非参数检验? 医 学 统 计 学(第二版) 李晓松 5. 5. 对比组数对比组数 v单组问题(样本与与已知总体参数比较) v两组问题 v多组(3组或以上)比较 注意,多组比较在差别有统计学意义时,需 再进行两两比较。 医 学 统 计 学(第二版) 李晓松 6. 6. 样本含量样本含量 在样本较小时:在样本较小时: uu如果是一个样本率与总体率的比较,可采如果是一个样本率与总体率的比较,可采 用直接计算概率的方法如基于二项分布的确切用直接计算概率的方法如基于二项分布的确切 概率法。概率法。 uu如果是四格表资料则采用如果是四格表资料则采用FisherFisher确切概

7、率确切概率 法或校正卡方检验。法或校正卡方检验。 uu对于均数比较问题,一般情况下采用对于均数比较问题,一般情况下采用t t检检 验。验。 在大样本时:在大样本时:可考虑可考虑Z Z检验检验作近似。作近似。 医 学 统 计 学(第二版) 李晓松 在实际工作中,遇到的实际问题可能并非 如此简单,须结合专业问题和所要分析的 具体内容加以综合考虑和仔细判断,有时 需对各种统计方法加以综合运用。 医 学 统 计 学(第二版) 李晓松 此外: 当分析目的是分析变量之间是否存在某种 联系时,这就涉及到双变量的分析方法, 即相关关系或回归关系的分析。 需注意相关分析和回归分析的区别与联系 医 学 统 计 学

8、(第二版) 李晓松 关联性分析:关联性分析: vv对于对于定量变量定量变量,需根据两个变量是否满足双变量,需根据两个变量是否满足双变量 正态分布,相应地采用正态分布,相应地采用PearsonPearson积矩相关分析或积矩相关分析或 SpearmanSpearman秩相关分析。秩相关分析。 vv对于对于等级变量等级变量则直接采用则直接采用SpearmanSpearman秩相关分析秩相关分析 。 医 学 统 计 学(第二版) 李晓松 vv对分类变量,常计算列联系数进行分析对分类变量,常计算列联系数进行分析 对于对于R R C C表资料,需注意区分是表资料,需注意区分是单向单向 有序有序或者是或者

9、是双向有序双向有序 对于一个二分类变量和一个等级变量对于一个二分类变量和一个等级变量 之间的线性关联通常采用线性趋势卡方检之间的线性关联通常采用线性趋势卡方检 验验 医 学 统 计 学(第二版) 李晓松 表表4. 4. 某市不同年级中学生吸烟率某市不同年级中学生吸烟率 年级年级调查人数 调查人数( (n n) )吸烟人数吸烟人数( (t t) )吸烟率吸烟率(%)(%) 初一初一144 144171711.8111.81 初二初二148 148191912.8412.84 初三初三135 135252518.5218.52 高一高一157 157414126.1126.11 高二高二168 1

10、68555532.7432.74 高三高三139 139727251.8051.80 合计合计891 891229229 医 学 统 计 学(第二版) 李晓松 生存分析:生存分析: vv是一类较为特殊的针对具有截尾数据的生是一类较为特殊的针对具有截尾数据的生 存时间数据所进行的分析存时间数据所进行的分析 vv针对分组和未分组资料,方法有所不同针对分组和未分组资料,方法有所不同 医 学 统 计 学(第二版) 李晓松 多变量的数据分析:多变量的数据分析: vv多重线性回归多重线性回归是对反应变量为是对反应变量为定量变量定量变量进行的多进行的多 变量分析变量分析 vvLogisticLogistic

11、回归回归是对反应变量为是对反应变量为分类变量分类变量所进行的所进行的 多变量分析多变量分析 vvCoxCox比例风险回归比例风险回归是对反应变量为含有截尾数据是对反应变量为含有截尾数据 的的生存时间生存时间所进行的分析所进行的分析 医 学 统 计 学(第二版) 李晓松 一、统计方法选择的基本思路一、统计方法选择的基本思路 二、统计分析需注意的若干问题二、统计分析需注意的若干问题 医 学 统 计 学(第二版) 李晓松 1. 1. 数据分析通常的步骤数据分析通常的步骤 数据探测 统计描述 统计推断 医 学 统 计 学(第二版) 李晓松 数据探测数据探测 数据分布特征、方差齐性、散点图绘制、离群数据

12、分布特征、方差齐性、散点图绘制、离群 值的发现,以及了解数据是否符合特定统计方值的发现,以及了解数据是否符合特定统计方 法的应用条件等,法的应用条件等,必要时可进行变量变换或转必要时可进行变量变换或转 换换以满足分析的需要。以满足分析的需要。 数据探测将增加对数据的基本了解,为进一步数据探测将增加对数据的基本了解,为进一步 的分析奠定基础。的分析奠定基础。 医 学 统 计 学(第二版) 李晓松 统计描述统计描述 统计描述内容?统计描述内容? 注意首先要区分注意首先要区分变量类型变量类型 医 学 统 计 学(第二版) 李晓松 统计推断统计推断 在数据探测和统计描述的基础上选择恰在数据探测和统计描

13、述的基础上选择恰 当的统计推断方法分析资料当的统计推断方法分析资料。 医 学 统 计 学(第二版) 李晓松 vv区间估计:区间估计: 总体均数区间估计总体均数区间估计:可采用:可采用 t t 分布或正态分布或正态 分布原理进行估计分布原理进行估计 总体率区间估计总体率区间估计:可采用二项分布、:可采用二项分布、 PoissonPoisson分布或正态分布原理进行估计分布或正态分布原理进行估计 医 学 统 计 学(第二版) 李晓松 2. 2. 混杂因素的控制混杂因素的控制 vv非研究因素非研究因素的的“ “可比性可比性” ”问题问题 vv可比性好,各组观测指标之间的差异只能归可比性好,各组观测指

14、标之间的差异只能归 因于研究因素而不是其它原因因于研究因素而不是其它原因 医 学 统 计 学(第二版) 李晓松 vv如果各组在如果各组在研究因素之外的某种或某些因素研究因素之外的某种或某些因素 有所不同,那么这个或这些其它因素的效应有所不同,那么这个或这些其它因素的效应 就可能同研究因素的效应混淆在一起就可能同研究因素的效应混淆在一起 vv在这种情况下,通常的统计分析结论在进行在这种情况下,通常的统计分析结论在进行 因果推断时因果推断时常常是不可靠的常常是不可靠的 医 学 统 计 学(第二版) 李晓松 vv对于对于非研究因素非研究因素不具可比性不具可比性的资料,应采的资料,应采 用用统计调整技

15、术统计调整技术消除那些因素的影响消除那些因素的影响 vv对于具对于具有多个变量有多个变量的复杂情况,则需采用的复杂情况,则需采用 多变量分析多变量分析技术加以调整技术加以调整 医 学 统 计 学(第二版) 李晓松 分析阶段控制混杂因素可采用:分析阶段控制混杂因素可采用: 1) 1) 分层分析分层分析 2) 2) 标准化法标准化法 3) 3) 协方差分析协方差分析 4) 4) 多重回归多重回归 医 学 统 计 学(第二版) 李晓松 1) 1) 分层分析分层分析 Example:研究吸烟与健康的关系 吸烟与非吸烟者死亡率的比较 医 学 统 计 学(第二版) 李晓松 吸烟者与不吸烟者死亡率的直接比较

16、可 能存在问题 因为: 吸烟者多为男性,而男性比女性更易患心脏 病而发生死亡,吸烟者与未吸烟者之间死亡 率的差异也许是因为性别的差异 医 学 统 计 学(第二版) 李晓松 vv为了排除这种可能性,可以为了排除这种可能性,可以性别性别因素分层因素分层 ,再比较吸烟与非吸烟者的死亡率:,再比较吸烟与非吸烟者的死亡率: vv男性人群中,吸烟与不吸烟者进行比较男性人群中,吸烟与不吸烟者进行比较 vv女性人群中,吸烟与不吸烟者进行比较女性人群中,吸烟与不吸烟者进行比较 医 学 统 计 学(第二版) 李晓松 年龄可能又是另外一个混杂因素,这就需 要对年龄进行分层分析: 男男 4040岁岁 4040岁岁 女女 4040岁岁 4040岁岁 医 学 统 计 学(第二版) 李晓松 以上是通常的分层分析思路,但这并不能以上是通常的分层分析思路

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号