《方差分析SAS课件》由会员分享,可在线阅读,更多相关《方差分析SAS课件(19页珍藏版)》请在金锄头文库上搜索。
1、方差分析 方差分析SASp方差分析主要方差分析主要过程程说明明 p单因素方差分析因素方差分析p双因素无交互作用方差分析双因素无交互作用方差分析 方差分析SAS方差分析主要方差分析主要过程程说明明uANOVA过程格式及使用说明过程格式及使用说明uGLM过程格式及使用说明过程格式及使用说明方差分析SASuANOVA过程格式及使用说明过程格式及使用说明 对于平衡数据资料(各水平下等重复,数据没有对于平衡数据资料(各水平下等重复,数据没有丢失),一般用丢失),一般用ANOVA过程过程 .过程格式:过程格式: PROC ANOVA 选项选项; CLASS 处理因素;处理因素; MODEL 因变量因变量=
2、效应表效应表/选择项选择项; MEANS 效应表效应表 /选择项选择项;方差分析SASPROC ANOVA 语句的选项主要有:语句的选项主要有: DATA=数据集名数据集名 指明要分析的指明要分析的SAS数据集,缺省时数据集,缺省时SAS将使用最近建立的将使用最近建立的数据集数据集. OUTSTAT=输出数据集输出数据集 指定分析计算结果输出的数据集名指定分析计算结果输出的数据集名. CLASS语句指明分类变量,是语句指明分类变量,是ANOVA过程的必需语句,并且必过程的必需语句,并且必须出现在须出现在MODEL语句之前语句之前. 分类变量可以为数值型或字符型,分类分类变量可以为数值型或字符型
3、,分类变量的个数表示方差分析的因素个数变量的个数表示方差分析的因素个数. MODEL语句定义分析所用的效应模型,即方差分析的因变量和语句定义分析所用的效应模型,即方差分析的因变量和效应变量效应变量. 在方差分析过程中,关键在于定义线性数学模型,常用在方差分析过程中,关键在于定义线性数学模型,常用的模型定义语句有:的模型定义语句有: MODEL y=a 单因素一元方差分析单因素一元方差分析 MODEL y=a b 双因素无交互作用一元方差分析双因素无交互作用一元方差分析 MODEL y=a b a*b 双因素有交互作用一元方差分析双因素有交互作用一元方差分析MEANS语句用来计算该语句所列的每个
4、效应所对应的因变量均语句用来计算该语句所列的每个效应所对应的因变量均值,其选项用于设定多重比较的方法值,其选项用于设定多重比较的方法. 过程说明:过程说明:方差分析SASuGLM过程格式及使用说明过程格式及使用说明 GLM GLM 即广义线性模型即广义线性模型(General Liner ModelGeneral Liner Model)过程,)过程,对于对于非平衡数据,应采用非平衡数据,应采用GLM过程过程.它使用它使用最小二乘法对数据拟合广义线性模型最小二乘法对数据拟合广义线性模型. . 该过程功能强大,可用于多种不同的统该过程功能强大,可用于多种不同的统计分析中计分析中. GLM. GL
5、M过程用于方差分析时,过程用于方差分析时,主要语句和使用格式与上述主要语句和使用格式与上述ANOVAANOVA过程过程类似类似 .方差分析SAS单因素方差分析因素方差分析u单因素等重复方差分析单因素等重复方差分析(ANOVA过程过程)u单因素不等重复的方差分析(单因素不等重复的方差分析(GLM过过程)程) 方差分析SASu单因素等重复方差分析单因素等重复方差分析(ANOVA过程过程) 应用实例应用实例源程序源程序运行结果运行结果方差分析SAS应用实例应用实例 一个工厂用三种不同的工艺生产某种电池一个工厂用三种不同的工艺生产某种电池. 从三种工艺生产的电从三种工艺生产的电池中分别抽取池中分别抽取
6、5个样品,测得样品寿命的数据如下(单位小时):个样品,测得样品寿命的数据如下(单位小时): A重复工艺1工艺2工艺314026392463440338304344228485443250平均423044我们要研究的指标是电池的寿命,工艺是影响寿命的一个因素,三我们要研究的指标是电池的寿命,工艺是影响寿命的一个因素,三种工艺分别是该因素的三个水平种工艺分别是该因素的三个水平. 在试验中我们假设其它因素都处于在试验中我们假设其它因素都处于相同的状态相同的状态. 这里我们希望利用上面得到的数据来考察这里我们希望利用上面得到的数据来考察“工艺工艺”的不同的不同是否对是否对“寿命寿命”这个指标有影响?这
7、个指标有影响?方差分析SAS源程序源程序 Data exam; /*建立数据集建立数据集*/ Do trt=1 to 3; /*3个处理(个处理(trt)分别为)分别为1、2、3*/ Do I=1 to 5; /*每个处理下每个处理下5次重复次重复*/ Input x; Output; End; End; Cards; 40 46 38 42 44 26 34 30 28 32 39 40 43 48 50 ; Proc anova; /*调用方差分析过程调用方差分析过程*/ Class trt; /*定义处理为分类变量定义处理为分类变量*/ Model x=trt; /*定义效应模型定义效应
8、模型*/ Title 方差分析方差分析; Run;方差分析SAS运行结果运行结果 Analysis of Variance ProcedureDependent Variable: XSource DF Sum of Squares Mean Square F Value Pr FModel 2 573.33333333 286.66666667 19.77 0.0002Error 12 174.00000000 14.50000000CT 14 747.33333333 R-Square C.V. Root MSE X Mean 0.767172 9.847982 3.80788655 38
9、.66666667 以上结果相当于方差分析表,以上结果相当于方差分析表, F值为值为19.77,显著性水平为显著性水平为0.0002,小于,小于0.01,说明各处理间,说明各处理间的均值差异极显著的均值差异极显著. 方差分析SASu单因素不等重复的方差分析(单因素不等重复的方差分析(GLM过程)过程) 应用实例应用实例源程序源程序运行结果运行结果方差分析SAS 某食品公司对一种食品设计了四种新包装某食品公司对一种食品设计了四种新包装. 为了考察为了考察哪种包装受欢迎,选取了十个有近似相同销售量的商店作哪种包装受欢迎,选取了十个有近似相同销售量的商店作试验,其中两种包装各指定两个商店销售,另两种
10、包装各试验,其中两种包装各指定两个商店销售,另两种包装各指定三个商店销售指定三个商店销售. 在试验期间,各商店的货架排放位在试验期间,各商店的货架排放位置,空间都尽量一致,营业员也采用相同的促销方法置,空间都尽量一致,营业员也采用相同的促销方法. 一一段时间的销售量记录如表所示段时间的销售量记录如表所示 应用实例应用实例 包装类型商店1121419242181217303132130395754方差分析SAS源程序源程序Dm LOG;CLEAR;OUTPUT;CLEAR;Data new;Input str$ x; /*x表示含销售量,str表示包装处理*/Cards;A1 12 A1 18A
11、2 14 A2 12 A2 13A3 19 A3 17 A3 21A4 24 A4 30;Proc print;Title 单因素不等重复方差分析;Proc glm;Class str;Model x=str;Run;方差分析SAS运行结果运行结果 General Linear Models ProcedureDependent Variable: XSource DF Sum of Squares Mean Square F Value Pr FModel 3 258.00000000 86.00000000 11.22 0.0071Error 6 46.00000000 7.6666666
12、7CT 9 304.00000000R-Square C.V. Root MSE X Mean0.848684 15.38264 2.76887462 18.00000000 由方差分析表中看到,组间平方和为由方差分析表中看到,组间平方和为258,组内平,组内平方和为方和为46,总的平方和为,总的平方和为304,F值为值为11.22,显著性水,显著性水平达到平达到0.007,包装不同对销售量的影响极显著,包装不同对销售量的影响极显著. 方差分析SAS双因素无交互作用方差分析双因素无交互作用方差分析应用实例应用实例源程序源程序运行结果运行结果方差分析SAS 在一个小麦种植试验中,考察在一个小麦种
13、植试验中,考察4种不同肥料(因素种不同肥料(因素A)与)与3种不种不同品种(因素同品种(因素B),选择),选择12块形状、大小等条件尽量一致的地块,块形状、大小等条件尽量一致的地块,每块以每块以 做一个处理,得如下数据,见表(单位:公斤做一个处理,得如下数据,见表(单位:公斤/亩)亩). 在在 水平下检验假设:水平下检验假设: (1)使用不同肥料小麦平均产量无差异;)使用不同肥料小麦平均产量无差异; (2)不同品种的小麦平均产量无差异)不同品种的小麦平均产量无差异. 应用实例应用实例 产量B小麦品种 123 肥A 料 种 类11641721742155157147315916615841581
14、57153方差分析SAS源程序源程序 Data new; Do a=a1, a2, a3, a4; Do b=b1,b2,b3; Input y; Output; End; End; Cards; 164 172 174 155 157 147 159 166 158 158 157 153 ; Proc print data=new; Run; Proc anova; Class a b; Model y=a b; Run;方差分析SAS运行结果运行结果 Analysis of Variance ProcedureDependent Variable: YSource DF Sum of S
15、quares Mean Square F Value Pr FModel 5 554.00000000 110.80000000 6.16 0.0234Error 6 108.00000000 18.00000000CT 11 662.00000000R-Square C.V. Root MSE Y Mean0.836858 2.651650 4.24264069 160.00000000Source DF Anova SS Mean Square F Value Pr F A 3 498.00000000 166.00000000 9.22 0.0115 B 2 56.00000000 28.00000000 1.56 0.2856输出的第一个方差分析表表明两个因子方差分析模型是显著的,输出的第一个方差分析表表明两个因子方差分析模型是显著的,F=6.16,p=0.0234;第二张表中因素;第二张表中因素A的效应平方和为的效应平方和为498,因,因素素B的效应平方和为的效应平方和为56,两者的,两者的F值分别为值分别为9.22和和1.56,显著性水,显著性水平分别为平分别为0.0115和和0.2856,结果表明,施肥种类对产量的影响显,结果表明,施肥种类对产量的影响显著;而三个小麦品种对产量的影响不显著著;而三个小麦品种对产量的影响不显著. 方差分析SAS