多元方差分析与重复测量方差分析

上传人:n**** 文档编号:50613401 上传时间:2018-08-09 格式:PPT 页数:39 大小:878KB
返回 下载 相关 举报
多元方差分析与重复测量方差分析_第1页
第1页 / 共39页
多元方差分析与重复测量方差分析_第2页
第2页 / 共39页
多元方差分析与重复测量方差分析_第3页
第3页 / 共39页
多元方差分析与重复测量方差分析_第4页
第4页 / 共39页
多元方差分析与重复测量方差分析_第5页
第5页 / 共39页
点击查看更多>>
资源描述

《多元方差分析与重复测量方差分析》由会员分享,可在线阅读,更多相关《多元方差分析与重复测量方差分析(39页珍藏版)》请在金锄头文库上搜索。

1、浙江大学医学院流行病与卫生统计学教研室 沈毅多变量方差分析与重复测量方差分析多变量方差分析与重复测量方差分析浙江大学医学院流行病与卫生统计学教研室 沈毅在医学研究中,尤其在临床试验中,每个观察对象记录的观察结果通常有多个反应变量(responsible variable)。例如,血压记录有收缩压、舒张压、脉压等;血脂记录有胆固醇脂、甘油三酯 、磷脂、未脂化脂肪酸等;心功能、肺功能、微循环的检测记录 项目则可多达十几个乃至几十个,这种有多个反应变量的数据称 为多变量数据(multivariate data)。在数据处理时,如果只有一个反应变量但有多个解释变量,有时也称为多变量数据。要注意多变量数

2、据与多因素试验的区别:多因素试验指的是有多个干预因素(分组因素)的试验,尽管析因设计方差分析和正交 设计方差分析可以分析多个试验因素的作用,但试验结果只有一 个反应变量,仍然是单变量方差分析。描述和表达时采用了适合多变量的向量和矩阵的表示方法。浙江大学医学院流行病与卫生统计学教研室 沈毅解释变量解释变量(处理因素)(处理因素)反应变量反应变量Y Y解释变量解释变量(处理因素)(处理因素)Y Y1 1Y Y2 2Y Y3 3反反应应变变量量只有一个反应变量的模型只有一个反应变量的模型具有多个反应变量的模型具有多个反应变量的模型浙江大学医学院流行病与卫生统计学教研室 沈毅治疗组治疗组对照组对照组反

3、应变量(效应)反应变量(效应)T T3 3T T4 4T T8 8T T3 3T T4 4T T8 8处理因素处理因素如何比较二组的如何比较二组的T T细胞免疫功能?细胞免疫功能?1 1、如果、如果T T3 3、T T4 4和和T T8 8各指标间不相关(独立?)且满足正态分布各指标间不相关(独立?)且满足正态分布 和方差齐性,则考虑用和方差齐性,则考虑用t t检验。问题是检验。问题是t t检验可能出现多种结果(检验可能出现多种结果( 本例可能有本例可能有8 8种结果)有时不一定能解释或很难解释。其次多重种结果)有时不一定能解释或很难解释。其次多重t t 检验会增加检验会增加I I型错误的概率

4、。型错误的概率。2 2、将、将T T3 3、T T4 4和和T T8 8三个指标看成一个整体,用多变量统计的方法三个指标看成一个整体,用多变量统计的方法 来分析比较。来分析比较。浙江大学医学院流行病与卫生统计学教研室 沈毅多元方差分析例1 将某班的学生按班级随机分成两组,一组施以素质教育,另一组仍用传统的应试教育,考察某次摸底考试的两种教育模型对学生成绩(如语文、数学 、外语、体育等)的影响。v 很容易想到的分析方法是对两组学生各科成绩进行 t 检验,分别计算各门课程的 t 值、p值,回答素质教育是否降低学生的单科成绩,如语文、数学成绩等,但很可能出现的结果是:某一(几)门课程成绩检验结果p0

5、.05。浙江大学医学院流行病与卫生统计学教研室 沈毅多个反应变量用单变量分析方法有以下几个缺点:1. 检验效率低2. 犯一类错误的概率增大3. 一元分析结果不一致时,难以下一个综合结论4. 忽略了变量间相关关系对这一类资料进行分析有两种思路:1. 因子分析:先对因变量中蕴含的信息进行浓缩,然 后再对提取出的公因子进行后续的分析。2. 多元方差分析多元方差分析浙江大学医学院流行病与卫生统计学教研室 沈毅与一个反应变量的方差分析相似,都是将反应变量的变异分解成为两部分:一部分为两组间变异(组别因素的效应),一部分为组内变异(随机误差)。然后对这两部分变异进行进行比较,看是否组间变异大于组内变异。不

6、同的是,后者都是对组间均方与组内均方进行比较,而前者是对组间方差协方差矩阵与组内方差协方差矩阵进行比较。多元方差分析的基本思想浙江大学医学院流行病与卫生统计学教研室 沈毅各因变量服从多元正态分布:只要一个反就变量不服从正态分布,则这几个反应变量的联合分布肯定不服从多元正态分布。 各观察对象之间相互独立。 各组观察对象反应变量的方差协方差矩阵相等。 反应变量间的确存在一定的关系,这可以从专业或研究目的角度予以判断。多元方差分析对资料的要求浙江大学医学院流行病与卫生统计学教研室 沈毅将等号两边平方,整理后得下式:具有多个反应变量时,将单个均数和方差改用均数向量和协方差矩阵此式即为多变量Hotell

7、ing T2检验浙江大学医学院流行病与卫生统计学教研室 沈毅通过菜单:GLM过程通过编程:MANOVA过程区别:对分类变量进行参数估计时应用的矩阵不同GLM过程采用的类似产生哑变量的形式,以某一水平为参照水平,其他水平与参照水平进行比较,即Indicator对比(Indicator Contrast)或Simple 对比(Simple Contrast)。MANOVA过程各水平与各水平的平均值进行比较,即Deviation对比(Deviation Contrast)。SPSS中的实现方式浙江大学医学院流行病与卫生统计学教研室 沈毅例1某妇幼保健院将孕妇随机分两组,一组接受孕期保健教育,另一组作

8、为对照。观察同一日出生的13名顺产婴儿的体重和身高,问孕期保健教育对婴儿生长发育有无促进作用?分析实例婴儿 编号保健教育组婴儿 编号对照组 身长(cm)体重(kg)身长(cm)体重(kg)13.355013.205024.105023.004633.505333.004543.645043.354753.605252.605064.005563.345273.0052表1 13名婴儿出生时的身高与体重浙江大学医学院流行病与卫生统计学教研室 沈毅单变量分析:独立样本t检验浙江大学医学院流行病与卫生统计学教研室 沈毅两组平均体重不同(t=4.112,p=0.002) ,两组平均身高无统计学差异 (

9、t=1.998,p=0.071)如何评价?浙江大学医学院流行病与卫生统计学教研室 沈毅Multivariate 过程浙江大学医学院流行病与卫生统计学教研室 沈毅Multivariate 过程浙江大学医学院流行病与卫生统计学教研室 沈毅方差齐性检验Multivariate 过程浙江大学医学院流行病与卫生统计学教研室 沈毅分析结果(1) 组间变量v 组间变量(Between-Subjects Factors)为教育方式,各自变量取值水平对应的频数分别为6、7及各组的均数和标准差Multivariate 过程浙江大学医学院流行病与卫生统计学教研室 沈毅v 对教育方式的统计学检验结果为p0.006,说

10、明两种教育方式对婴儿生长发育差别有统计学意义。分析结果(2) 多元方差分析结果Multivariate 过程浙江大学医学院流行病与卫生统计学教研室 沈毅分析结果(3) 一元方差分析结果Multivariate 过程浙江大学医学院流行病与卫生统计学教研室 沈毅v 多元方差分析对于资料的正态性影响较稳健,而对于各组方差协方差阵是否齐性较为敏感,上表为对于各组间协方差阵是否为齐性的Box检验,Box检验统计量=0.771,经过变换计算后F=0.206,p=0.892,说明两组婴儿间的总体协方差相等。分析结果(4) Box检验Multivariate 过程浙江大学医学院流行病与卫生统计学教研室 沈毅v

11、 这是按照自变量的取值水平组合,考察每个反应变量在不同的水平组合间的方差是否齐性的Levenes检验,结果表明2个变量的方差均齐。分析结果(5) Levenes检验Multivariate 过程浙江大学医学院流行病与卫生统计学教研室 沈毅多变量分析与单变量分析多变量分析是对m个反应变量进行一次假设检验(Hotelling T2检验或MANOVA),对组间差别作出推断。在大多数情况下,多变量假设检验结论与对m个反应变量进行m次单变量假设检验(t检验或ANOVA)的结论是一致的,即多变量假设检验拒绝H0,m次单变量假设检验至少有一次拒绝H0,SPSS、SAS等统计软件也是先给出多变量假设检验结果,

12、再给出单变量假设检验结果,作为多变量分析的补充。浙江大学医学院流行病与卫生统计学教研室 沈毅但理论上单变量假设检验不能代替多变量假设检验,主要理由: m次单变量假设检验增加假阳性错误的概率,设每次单变量假设检验的检验水准定为a,做完m次检验I类错误的概率增加为am1-(1-a)m。单变量假设检验只说明某一变量在数轴分布上的组间差别,不能反映多个变量在平面或空间上的差别,两者的意义不同,各自说明各自的问题,不能相互代替。如表1的两组数据,分别对两组新生儿出生时的体重与身长做单变量t检验:体重t=4.112,p=0.002,拒绝H0,身长t=1.998,p=0.071,,不能拒绝H0。但双变量的H

13、otelling T2检验:T2=9.87,F=4 .58,P=0.03,拒绝H0:1= 2,两组在平面分布上差别如下图所示。浙江大学医学院流行病与卫生统计学教研室 沈毅身高与体重在数轴上的分布在体重的分布上,保健 组大多数婴儿的体重都 大于平均体重,对照组 婴儿的体重都在平均体 重以下,在身高的分布 上二组婴儿的身高比较 均匀分散的均数的两侧。浙江大学医学院流行病与卫生统计学教研室 沈毅二组婴儿的身高与体重在空间分布上的差异保健教育组对照组浙江大学医学院流行病与卫生统计学教研室 沈毅重复测量的方差分析v 重复测量的资料:在日常研究中常需对一个观察单位重复进行多次测量,这样所获得的资料称之为重

14、复测量资料。v对于观察单位的定义不同,重复进行观察的方式不同,重复测量的资料也有着形形色色的表现。浙江大学医学院流行病与卫生统计学教研室 沈毅一般来说,研究设计中考虑以下问题时应采用重复测量设计:研究主要目的之一是考察某在不同时间的变化情况。研究 个体间变异很大,应用普通研究设计的方差分析时,方差分析表中的误差项值将很大,即计算F值时的分母很 大,对反应变量有作用的因素常难以识别。 有的研究中研究对象很难征募到足够多的数量,此时可考虑对所征募到的对象在不同条件下的反应进行测量。重复测量的方差分析浙江大学医学院流行病与卫生统计学教研室 沈毅基本原理v 基本思想:仍然应用方差分析的基本思想,将反应

15、变量的变异分解成以下四个部分:研究对象内的变异(即测量时间点或测量条件下的效应) 、研究对象间的变异(即处理因素效应)、上述两者的交互作用、随机误差变异。v 因素:受试者内因素-用于区分重复测量次数的变量受试者间因素-在重复测量时保持恒定的因素 v 分析目的:一是分析受试者间因素的作用;二是考察随着测量次数的增加,测量指标是如何发生变化的,以及分组因素的作用是否会随时间发生,即是否和时间存在交互作用。浙江大学医学院流行病与卫生统计学教研室 沈毅应用条件反应变量之间存在相关关系。反应变量的均数向量服从多元正态分布。对于自变量的各取值水平组合而言,反应变量的方差协方差阵相等。浙江大学医学院流行病与

16、卫生统计学教研室 沈毅实例分析例2 为了研究饮食、活动锻炼种类与人脉搏的关系,某医生将18个人随机分配到饮食结构不同的两组,且每组成员又被随机分配至三种体育锻炼活动组。数据见repeated.sav浙江大学医学院流行病与卫生统计学教研室 沈毅Repeated Measures 过程浙江大学医学院流行病与卫生统计学教研室 沈毅v 定义组内变量名pluse,并输入水平数:3,得 pluse(3)Repeated Measures 过程重复测量的变量名次数浙江大学医学院流行病与卫生统计学教研室 沈毅Repeated Measures 过程浙江大学医学院流行病与卫生统计学教研室 沈毅Repeated Measures 过程分析结果(1) 组内、组间因素组内因素:重复 测量各时点变量组间因素:活动锻 炼、饮食不同种类浙江大学医

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号