SAS系统和数据分析协方差分析

上传人:cl****1 文档编号:470570460 上传时间:2022-10-30 格式:DOCX 页数:18 大小:84.24KB
返回 下载 相关 举报
SAS系统和数据分析协方差分析_第1页
第1页 / 共18页
SAS系统和数据分析协方差分析_第2页
第2页 / 共18页
SAS系统和数据分析协方差分析_第3页
第3页 / 共18页
SAS系统和数据分析协方差分析_第4页
第4页 / 共18页
SAS系统和数据分析协方差分析_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《SAS系统和数据分析协方差分析》由会员分享,可在线阅读,更多相关《SAS系统和数据分析协方差分析(18页珍藏版)》请在金锄头文库上搜索。

1、第二十六课协方差分析当定量的影响因素对观察结果有难以控制的影响,甚至还有交互作用时,采用协方差分 析,这些影响变量称为协变量,扣除(或消除)协变量的影响,可以得到修正后的均值估计。一、协方差分析概述1. 协方差分析概念协方差分析(analysis of covariance)又称带有协变量的方差分析(analysis of variance with covariates),是将回归分析与方差分析结合起来使用的一种分析方法。在各种试验设计中,对 主要变量y研究时,常常希望其他可能影响和干扰y的变量保持一致以到达均衡或可比,使 试验误差的估计降到最低限度,从而可以准确地获得处理因素的试验效应。但

2、是有时,这些 变量难以控制,或者根本不能控制。为此需要在试验中同时记录这些变量的值,把这些变量 看作自变量,或称协变量(covariate),建立因变量y随协变量变化的回归方程,这样就可以 利用回归分析把因变量y中受协变量影响的因素扣除掉,从而,能够较合理地比较定性的影 响因素处在不同水平下,经过回归分析手段修正以后的因变量的总体均值之间是否有显著性 的差别。简单地说,协方差分析是扣除协变量的影响,或者将这些协变量处理成相等,再对 修正的y的均值作方差分析。2. 协方差分析的假定协方差分析需要满足的假定为: 各样本来自具有相同方差b 2的正态分布总体,即要求各组方差齐性。 协变量与主要变量y间

3、的总体回归系数不等于0。 各组的回归线平等,即回归系数卩二卩二1 2如果上述的假定满足,就作协方差分析。前述的各种试验设计,如完全随机化设计、随 机区组设计、析因设计、拉丁方设计等,都可以带一个或多个协变量,按设计方案扣除协变 量的影响后,对主要变量y的修正均值作比较,得出统计结论。3. 协方差分析的模型最简单的单因素一元协方差分析的模型,是由单因素效应模型y二卩+ a +加上协 iji ij变量的影响因素0 (x -x)而得出:y =卩 + a + 0 (x x ) + 匕(26.ijiijij其中,x为协变量,x为协变量在分类水平i和j上的记录值,x为所有协变量的平均 ij值,0为相关的回

4、归系数。设00二卩-0x,为平均截距。上式可以化简成:上海财经大学经济信息管理系IS/SHUFE(26.2)(26.3)y P + a + (3x + ij 0 i ij ij设P P + a,上式可以化简成:0i0 iy P + Px + ij0 iij ij很明显p o是第/组回归线的截距,等于回归线的平均截距p o加上本组的效应a。这个式揭示了,观察值y的模型可以表示成一组相似的回归线,且各组具有共同的回归系数P, ij和各组自己的截距P -B +a。0i0 i用SAS中的glm过程进行协方差分析时,要注意不同试验设计时class语句和model语句的写法。设分类变量为A、B,协变量为X

5、,观察值为Y则有: 单因素k水平设计的协方差分析模型class A;model X A ; 随机区组设计的协方差分析模型class A B;model X A B ; 两因素析因设计的协方差分析模型class A B;model X A B A*B;二、实例分析1. 一元协方差分析例261研究牡蛎在不同温度的水中不同位置上的生长情况。有人做了如下试验:分别 在通向发电站的入口处(温度较低)不同位置(底部和表层)和出口处(温度较高)不同位 置(底部和表层)及电站附近的深水处(底部和表层的中间)总共5个不同位置点上,随机 地各放4袋牡蛎(每袋中有10个),共5X4=20袋。在将每袋牡蛎放入位置点之

6、前,先洗干 净称出每袋的初始体重,放在5个不同点一个月后再称出最后体重。试验结果数据如表26.1 所示。表26.1牡蛎在不同温度和位置上的生长数据位置trt重复数rep (x为初始体重,y为最后体重)1234xyxyxyxy1 (入口底部)27.232.632.036.633.037.726.831.02 (入口顶部)28.633.826.831.726.530.726.830.43 (出口底部)28.635.222.429.123.228.924.430.24 (出口顶部)29.335.021.827.030.336.424.330.55 (附近中部)20.424.619.623.425.1

7、30.318.121.8程序如下:datagrowth;do trt=1 to 5;do rep=1 to 4;input x y;output;end;end;cards;27.232.632.036.633.037.726.831.028.633.826.831.726.530.726.830.428.635.222.429.123.228.924.430.229.335.021.827.030.336.424.330.520.424.619.623.425.130.318.121.8proc anova data二growth;class trt;model y=trt;proc glm

8、 data二growth;class trt;model y=trt x /solution;means trt;lsmeans trt /stderr tdiff;contrast trt12 vs trt34 trt -1 -1 1 1 0;estimate trt1adj mean intercept 1trt 10000x25.76;estimate trt2adj mean intercept 1trt 01000x25.76;estimate adj trt diff trt 1 -1 0 0 0;estimate trt1unadj mean intercept1 trt1000

9、0x 29.75;estimate trt2unadj mean intercept1 trt01000x 27.175;estimate unadj trt diff trt 1 -1 0 0 0 x 2.575;run;程序说明:定性变量trt的5个不同位置点对y可能有较大的影响,因此class语句中分 组变量为trt,先选用anova过程进行方差分析。然而,牡蛎的初始体重x对牡蛎的最后体重 y可能也有一定的影响,故适合选用glm过程进行协方差分析,在model语句中不仅包括分 组变量trt,而且应包括协变量x。选择项solution要求输出回归系数的估计值及其标准误差和 假设检验等结果。

10、means和lsmeans语句要求输出分组变量trt各水平下y的未修正均值和修 正后的均值,选择项stderr要求输出y的修正均值的标准误差、各修正均值与0比较的假设 检验结果;选择项tdiff要求输出y的各修正均值之间两两比较所对应的t值和p值。Contrast语句是用来比较入口处底部和顶部均值之和与出口处底部和顶部均值之和是否 相等。前三条estimate语句是用来估计入口处底部和顶部调整后的均值及它们之差,并假设 检验是否为0,后三条estimate语句是用来估计入口处底部和顶部未调整的均值及它们之差, 并假设检验是否为0。程序输出的主要结果如表26.2 (a)、表26.2 (b)、表2

11、6.2 (c)所示。表 26.2 (a)单因素trt 一元x的协方差分析The SAS SystemAnalysis of Variance ProcedureDependent Variable: YSourceDFSum of SquaresMean SquareF ValuePr FModel4198.4070000049.601750004.640.0122Error15160.2625000010.68416667CorrectedTotal 19358.66950000R-SquareC.V.Root MSEY Mean0.55317510.597063.2686643630.84

12、500000SourceDFAnova SSMean SquareF ValuePr FTRT4198.4070000049.601750004.640.0122General Linear ModelsProcedureDependentVariable: YSourceDFSum of SquaresMean SquareF ValuePr FModel5354.4471767570.88943535235.050.0001Error144.222323250.30159452CorrectedTotal 19358.66950000R-SquareC.V.Root MSEY Mean0.

13、9882281.7804380.5491762230.84500000SourceDFType I SSMean SquareF ValuePr FTRT4198.4070000049.60175000164.470.0001X1156.04017675156.04017675517.380.0001SourceDFType III SSMean SquareF ValuePr FTRT412.089359283.0223398210.020.0005X1156.04017675156.04017675517.380.0001T for H0:Pr |T|Std ErrorofParameterEstimateParameter=0EstimateINTERCEPT2.494859769 B2.430.02931.02786287表26.2(a)中结果分析:对分组变量trt的方差分析表明,即使当初始体重x不考虑,各分 组最后体重均值的区别也统计显著(0.0122V0.05),其中分组变量trt的平方和为198.40700000。 而在协方差分析中,分组变量trt的类型1的平方和等于方差分析中的平方和198.40700000, 分组变量trt的类型3的平方和为12.08935928,大大小于类型1的平方和,是因为类型3的 平方和反映了经过

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 机械/制造/汽车 > 电气技术

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号