第6章 方差分析(续) 方差分析的功能模块: Compare Means : One -Way ANOVA:单因素方差分析 General inearModel: Univariate:单因变量多因素方差分析 Multivariate :多因变量多因素方差分析 Repeated Measure:重复测量方差分析 Variance Components:方差成分分析,是对一个因变量受多个因素(或因子)影响而进行的方差分析 作用-用于检验不同水平组合之间因变量均值由于受不同因素影响是否有差异的问题 原假设H0:因变量总体均值相等 可以分析每一个因素的作用(主效应),也可以分析因素之间的交互作用(交互效应) 可以进行协方差分析,以及各因素变量与协变量之间的交互作用6.2 Univariate(1):单因变量多因素方差分析,固定因素 (Fixed factor) –其不同水平对实验结果产生不同影响的因素,其水平都出现,即分组变量 随机因素 ( Random factor )-对实验结果产生随机影响的因素,其水平随机出现,影响的大小可以通过方差成分分析确定 协变量(Covariate )-一种难以控制的自变量 ,用以借助回归方程,剔除相应因素对因变量的影响。
协方差分析时用 注意-因变量和协变量必须是数值型变量,协变量与因变量彼此不独立因素变量(控制、随机)是分类变量,可以是数值型和字符型变量定义:对单因变量多因素方差分析,变量定义时,最基本需要:一个是因变量(观测变量);多个分组变量(固定变量) 数据录入:将各水平下数据都录入到因变量内;各控制变量不同水平区分用分组值进行(如1,2,3等) 【实例6.2】研究不同性别学生非智力因素对学习成绩的影响,数据如表:,数据准备:该问题有一个因变量chj,两个固定因素变量:性别xb(男、女)和非智力因素fzl(高、中、低)设置界面:,观测变量,一个,控制因素,可多个,随机因素,不是必需,协变量-用于去除该变量对因变量的影响 ,协方差分析用,异方差时,将选入变量用加权最小二乘法估计模型参数,协方差分析用,【Model按钮】:,Full factorial 全模型,包括所有因素的主效应、交互效应、协变量主效应等是系统默认的模型 Custom 自定义模型用户可以选择实验中感兴趣的效应Factors&covariate-框中所列出的是主对话框中所选的因素:包括固定因素(标F)、随机因素(标R)、协变量因素(标C)。
本例中只含有固定因素 Build terms:针对所选因素选择不同的效应 Interaction 指定任意的交互效应; Main effects 指定主效应; All 2-way 指定所有2维交互效应; All 3-way 指定所有3维交互效应; All 4-way 指定所有4维交互效应 All 5-way 指定所有5维交互效应建立分析模型中的主效应方法: 选中一个因素变量名,再选中“Main effects”,单击右箭头按钮,该变量出现在“Model”框中欲在模型中包括几个主效应项,就进行几次操作或在标有“F”变量名中选中多个变量同时送到“Model”框中 本例将“xb”和“fzl”变量作为主效应,按上面的方法选送到“Model”框中 建立模型中的交互项: 例如,因素变量有“xb(F)”和“fzl(F)”,建立它们之间的相互效应 连续单击“xb(F)”和“fzl(F)”变量使其选中 单击“Build Term(s)”栏内下拉按钮,选中 “Interaction”项单击“Build Term(s)”栏内的右拉按钮,“xb*fzl”交互效应就出现在“Model”框中Sum of squares :分解平方和的选择项 Type I项:分层处理平方和。
仅对模型主效应之前的每项进行调整一般适用于:平衡的AN0VA模型; Type II项:对其他所有效应进行调整一般适用于:平衡的AN0VA模型、主因子效应模型、回归模型、嵌套设计 Type III项:默认,回归法对其他任何效应均进行调整一般适用于:Type I、Type II所列的模型:没有空单元格的平衡和不平衡模型 Type IV顶:一般适用于:Type I、Type lI所列模型;没有空单元的平衡和不平衡模型 Include intercept in model -在模型中包括截距若能确定回归线不通过原点,则不选此项 本题选择如下图所示:,两个主效应 一个交互效应,【contrast按钮】因素各水平间均值比较,想要改变比较方法的因子,比较方法选择,比较方法修改确认,选项说明:None:不进行均数比较 Deviation:比较因素变量的每个水平的效应可以选择“Last”(最后一个水平)或“First”(第一个水平)作为忽略的水平 Simple:对因素变量的每一水平都与参考水平进行比较选择“Last”或“First”作为参考水平比较的参考类,方法中选 “Deviation”或“Simple”才有效,Difference,对因素每一水平的效应,除第一水平以外,都与其前面各水平的平均效应进行比较。
与Helmert对照方法相反 Helmert,对因素的效应,除最后一个以外,都与后续的各水平的平均效应相比较 Repeated,对相邻的水平进行比较对预因素的效应,除第一水平以外,对每一水平都与它前面的水平进行比较 Polynomial,多项式比较第一级自由度包括线性效应与因素水平的交叉第二级包括二次效应等各水平彼此的间隔被假设是均匀的plots按钮】设置均值轮廓图 (Profile Plots),用于比较边际均值轮廓图是线图,图中每个点表明因变量在因素变量每个水平上的边际均值的估计值如果指定了协变量,该均值则是经过协变量调整的均值 因变量做轮廓图的纵轴;一个因素变量做横轴 单因素方差分析时,轮廓图表明该因素各水平的因变量均值; 双因素方差分析时,指定一个因素做横轴变量,另一个因素变量的每个水平产生不同的线;如果是三因素方差分析,可以指定第三个因素变量,该因素每个水平产生一个轮廓图双因素或多因素轮廓图中的相互平行的线表明在因素间无交互效应;不平行的线表明有交互效应横坐标框:一个因素变量,分线框:另一个因素变量,分图框:第三个因素变量 (若有),【注意】 (1)若只要选入Horlzontal Axis内因素变量各水平的因变量均值分布,则可选完该项后直接单击“Add”按钮,将所选因素变量移入下面的“Plots”框中。
否则,不点击“Add”按钮 (2)若想看两个因素变量组合的各单元格中因变量均值分布,或想看两个因素变量间是否存在交互效应,则选择另一个因素变量,送入“Separate Lines”框中然后,单击“Add”按钮,将自动生成的图形表达式送入到“Plots”栏中分线框中的变量的每个水平在图中是一条线post Hoc按钮】多重比较选择,【save按钮】选择保存运算值 可以将所计算的预测值、残差和检测值作为新的变量保存在编辑数据文件中以便于在其他统计分析中使用这些值残差类,预测值类,诊断值类,协方差矩阵,【option按钮】选择输出项,“Model”中指定的效应项,选择要显示的效应项,指定要求输出的统计量,对本例作如下设置,其它采用默认结果形式】,偏差来源,偏差平方和,均方,等于偏差平方和除以相应的自由度Soure栏说明: Corrected Model 校正模型,检验模型的统计学意义 其偏差平方和等于两个主效应xb、fzl平方和加上交互xb*fzl的平方和之和 Intercept 截距xb 性别主效应,检验不同性别对成绩的影响差异 fzl 非智力主效应,检验不同非智力对成绩影响差异 xb*fzl 性别和非智力交互效应,检验不同性别和非智力交互作用对成绩的影响差异。
Error 误差其偏差平方和反应的是组内差异也称组内偏差平方和 Total 是偏差平方和,在数值上等于截距+主效应+交互效应+误差偏差平方和 Corrected Total 校正总和其偏差平方和等于校正模型与误差之偏差平方和之总和结果分析】 (1)方差分析齐性检验的P=0.107,满足方差齐性 (2)模型检验F=19.117,P=0.0000.01,说明模型有统计学意义 (3)不同性别(xb)对学习成绩的偏差均方为1095.511,F=42.717,P=0.0000.05,即存在显著性差异; 不同非智力(fzl)对学习成绩的偏差均方为563.733,F=21.981,P=0.0000.05,即存在显著性差异;,(4)不同性别和不同非智力(xb*fzl)共同对学习成绩的偏差均方是114.178,F=4.452,P=0.0150.05,即存在显著性差异 (5)从非智力的各水平间的两两比较结果看: 水平高(1)与中(2)及中(2)与低(3)水平间存在显著性差异,说明中等程度的非智力因素比高等和低等对学习成绩的影响明显占优6.3 Univariate(2):协方差分析,协方差分析(Analysis of Covariance)是将线性回归分析与方差分析结合起来使用的一种统计分析方法。
基本原理:先将难以控制的因素看作自变量,称为协变量(Covariate,一般为连续型),建立因变量随协变量变化的回归方程,这样就可以利用回归方程把因变量的变化中受不易控制的协变量的影响扣除掉,从而能够较合理地比较固定因素处在不同水平下,经过回归分析手段修正后,因变量的总体均数间差异是否有统计学意义 原假设H0: 因变量总体均值相等 只有1个协变量时称为一元协方差分析;含有2个及2个以上协变量时称为多元协方差分析 如研究成人体重正常者和超重者的胆固醇的差异,应该剔除掉年龄的影响,则年龄可作为协变量协方差分析的应用条件: 理论上要求各组资料都来自方差齐性的正态总体;各组总体的直线回归系数相等,且都不为0 因此,严格地说,在对资料作协方差分析之前,应先对这两个前提条件作假设检验,若资料符合上述两个条件,或经变量变换后符合上述条件,方可进行协方差分析 【实例6.3】研究 3 个专业学生在《统计学》课程的成绩上是否存在差异 因这 3 个专业的学生入学数学成绩不同,即学习《统计学》的数学基础不同 , 因此分析《统计学》 成绩是否存在差异要考虑学生的入学数学成绩数据如表:,数据准备:设置一个因变量tj,一个固定因素变量zy(定类,1,2,3),一个协变量sx。
设置界面】,【结果形式】,【结果分析】 (1)模型检验F=7.943,P=0.0040.05,即不存在显著性影响; (3)专业(zy)对统计学成绩影响检验,F=10.534,P=0.0030.05即存在显著性影响(剔除掉sx后的结果)6.3 Multivariate :多因变量多因素方差分析 完全类似Univariate界面,只是可以选多个因变量6.4 Repeated Measure:重复测量方差分析,适用对象:同一受试对象的同一试验指标在不同时间点进行多次测量所得的资料常用于分析该试验指标在不同时间点上的变化情况 前提条件:满足正态性和方差齐性 因为当一个因变量被重复测量几次,从而同一个体的几次观察结果间存在相关,这样就不满足独立性的要求,但要求满足协方差矩阵的球形性(sphericity),否则应校正重复测量方差分析的总离差平方和分解为: 组间(between-subjects )离差:各处理间的离差平方和及被试间的离差平方和 组内(within-subjects)离差:被试内的离差平方和 其F统计量由它们及其自由度等构成 变量定义 重复测量方差分析,变量定义时,最基本需要:一个分组变量(固定变量);至少一组因变量(组内因素变量,个数与重复测量次数相等,且名称前部分一致,通过数字进行区分)。
数据录入 将测量结果分别录入到各指标。