第七章 方差分析和协方差分析

上传人:cn****1 文档编号:558923569 上传时间:2022-12-10 格式:DOC 页数:8 大小:86KB
返回 下载 相关 举报
第七章 方差分析和协方差分析_第1页
第1页 / 共8页
第七章 方差分析和协方差分析_第2页
第2页 / 共8页
第七章 方差分析和协方差分析_第3页
第3页 / 共8页
第七章 方差分析和协方差分析_第4页
第4页 / 共8页
第七章 方差分析和协方差分析_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《第七章 方差分析和协方差分析》由会员分享,可在线阅读,更多相关《第七章 方差分析和协方差分析(8页珍藏版)》请在金锄头文库上搜索。

1、第七章 方差分析和协方差分析(医学统计之星)上次更新日期: 方差分析和协方差分析在SAS系统中由SAS/STAT模块来完成,其中我们常用的有ANOVA过程和GLM过程。前者运算速度较快,但功能较为有限;后者运算速度较慢,但功能强大,我们做协方差分析时就要用到GLM过程。本章将首先介绍方差分析所用数据集的建立技巧,然后重点介绍这两个程序步。其实,这里的速度快慢只是相对而言,SAS的处理速度是首屈一指的。举个例子,这个暑假我做了一个有6600条记录的,7因素的,交叉设计的方差分析(是不是已经有人喊头痛了?),我先是用SPSS FOR WIN95 7.5来做,运行了大约10分钟才出结果。我又换用SA

2、S FOR WIN95 6.12来做,结果用了2.47秒!7.1 方差分析数据集的建立技巧7.1.1 方差分析的数据集格式统计分析所用的数据格式和我们在分析整理资料时所用的格式是不同的。一般来说,数据集中应至少有一个结果变量,用于记录不同处理因素水平下观察值的大小;至少有一个处理因素变量,用于记录处理因素的类型及其水平数。以单因素方差分析为例,就应有一个结果变量和一个处理因素变量;而两因素的方差分析应有一个结果变量和两个处理因素变量。例7.1 某职业病防治院对31名石棉矿工中的石棉肺患者、可疑患者及非患者进行了用力肺活量测定,请给出数据集的结构(卫统p44 例5.1)。解:数据集中应有两个变量

3、,x和group。x记录肺活量的大小;group取值为1、2或3,分别代表石棉肺患者、可疑患者及非患者。例7.2 某厂医务室测定了10名氟作业工人工前、工中及工后4小时的尿氟浓度,请给出数据集的结构(卫统p46 例5.2)。解:数据集中应有三个变量,x、group和worker。x记录尿氟浓度;group取值为1、2或3,分别代表工前、工中及工后;worker取值为1到10,分别代表10名工人。7.1.2 方差分析数据集的建立技巧可见方差分析的数据集其变量取值有一定的规律,因此可以利用循环语句和判断语句来简化输入。例7.3 请建立例6.1的数据集。解:我们可以一个一个的输入变量group的值,

4、但这里给出一种更酷的建立方法。libname a c:user;data a.wtli5_1;group=1;if _n_11 then此处的_n_为SAS系统变量,表明读入的数据为第几条记录,由于石棉肺患者只有11人,因此第12条记录只能是可疑患者的记录,同理,从第20条记录开始的只能是非患者的记录。这里利用判断语句来完成从_n_到group的转换。if _n_20 then group=3;else group=2;input value ;cards;1.8 1.4 1.5 2.1 . . 3.3 3.5;proc print;run;例7.4 请建立例7.2的数据集。解:此例中数据较有

5、规律,各组的例数均相等,这可正是循环语句大显身手的时候。libname a c:user;data a.wtli5_2;do group=1 to 3;这里的SAS语句非常类似于Foxbase语句,两个循环分别控制了group和worker的取值,这在输入数据时是常见的一种技巧。do worker=1 to 10;input value ;output;两个变量只是循环变量,因此要用output语句写入数据集中。end;end;cards;90.53 88.43 47.37 . 105.27 58.95请注意x变量和处理因素变量的对应关系,不要改变数据块的次序,否则建立的数据集是错的。;pro

6、c print;run;7.2 引 例例7.5 请回答在例7.1中三组石棉矿工的用力肺活量有无差别?解:由于是三组做比较,因此要用方差分析法。在建立数据集后可用ANOVA过程或GLM过程进行分析,同时给出选项进行各组均数的两两比较(此处用SNK法),两过程的输出格式基本一致。对于单因素的方差分析,在比较之前一般要考虑方差齐性的问题。这里可以用GLM过程中的HOVTEST选项实现,实际上这也是在SAS中做方差齐性检验的唯一途径。 设定数据库环境:LIBNAME A C:USER; 数据步,建立数据集(略): ANOVA或GLM过程,进行方差分析并同时做两两比较(SNK法):PROC ANOVA

7、DATA=A.WTLI5_1;PROC GLM DATA=A.WTLI5_1;CLASS GROUP;CLASS GROUP;MODEL VALUE=GROUP;MODEL VALUE=GROUP /SS1;MEAN GROUP /SNK;MEAN GROUP /SNK HOVTEST;RUN;RUN;这里的GLM过程中有两个选项,SS1要求只输出方差分析SS1模型的结果(默认输出SS1和SS3两种模型的结果),HOVTEST则要求进行方差齐性检验(该选项只能在SAS 6.12以上的版本中实现)。7.3 ANOVA过程ANOVA过程是SAS系统中用于方差分析的几个程序步之一,它适用于平衡的数据

8、。这意味着如果按所分析的变量将观测值分类,则每个格子内的观测值数目应相同。如果数据不满足这一要求,则ANOVA过程的分析结果并不可靠,分析者应改用GLM过程来处理数据。7.3.1 语法格式PROC ANOVA DATA= MANOVA按多元分析的要求略去有任一缺失值的记录OUTSTAT= ;指定统计结果输出的数据集名CLASS ;必需,指定要分析的处理因素MODEL / 选项;必需,给出分析用的方差分析模型MEANS / 选项 ;指定要两两比较的因素及比较方法BY ;FREQ ;MANOVA H= 效应 E= 效应 M= 公式.;指定多元方差分析的选项7.3.2 语法说明Means语句的选项主

9、要用来指定两两比较的方法和检验水准,主要有: 两两比较方法 BON(Bonferroni检验)、DUNCAN(新复极差法)、DUNNETT、GABRIEL、LSD(最小显著差法)、SCHEFFE、SIDAK 、SNK(q检验)、TUKEY 、WALLER 其它 ALPHA= p值 更改水准7.3.3 结果解释这里以例7.2的数据为例,ANOVA过程的输出结果分两大部分,第一部分是分析变量的列表描述,第二部分是统计结果,先是所用方差分析模型的检验,然后是各个处理因素和交互作用的检验结果,最后则是两两比较的结果。 Analysis of Variance Procedure 方差分析过程 Clas

10、s Level Information 处理因素取值情况Class Levels Values处理因素变量名 取值数 具体值GROUP 3 1 2 3WORKER 10 1 2 3 4 5 6 7 8 9 10 Number of observations in data set = 30 样本大小为30-以下为方差分析的统计结果部分,首先是对方差分析所用模型的检验- Analysis of Variance ProcedureDependent Variable: VALUE 应变量名为VALUESource DF Sum of Squares Mean Square F Value Pr

11、F变异来源 自由度 SS MS F p值Model 11 47895.87728667 4354.17066242 4.51 0.0024Error 18 17365.56086000 964.75338111Corrected Total 29 65261.43814667 R-Square C.V. Root MSE 应变量名 Mean 所用模型的决定系数 变异系数 剩余标准差 应变量均数 0.733908 28.27501 31.06047941 109.85133333-统计结果的第二部分,对各个具体处理因素及其交互作用的检验-Dependent Variable: VALUESour

12、ce DF Anova SS Mean Square F Value Pr F变异来源 自由度 SS MS F p值GROUP 2 8182.89340667 4091.44670333 4.24 0.0310WORKER 9 39712.98388000 4412.55376444 4.57 0.0030-统计结果的第三部分,对GROUP变量做两两比较,只有MEAN语句中指定了才会出现- Analysis of Variance Procedure Student-Newman-Keuls test for variable: VALUE 注意这里我们用SNK法做例子,其余比较方法的输出结果与之类似 NOTE: This test controls the type I experimentwise error rate under the complete null hypothesis but not under partial null hypotheses. Alpha= 0.05 df= 18 MSE= 964.7534 水准为0.05,自由度为18,MS误差为964.7534 Number of Means 2 3

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号