方差分析精品课程

上传人:桔**** 文档编号:502664568 上传时间:2023-07-24 格式:DOC 页数:53 大小:780KB
返回 下载 相关 举报
方差分析精品课程_第1页
第1页 / 共53页
方差分析精品课程_第2页
第2页 / 共53页
方差分析精品课程_第3页
第3页 / 共53页
方差分析精品课程_第4页
第4页 / 共53页
方差分析精品课程_第5页
第5页 / 共53页
点击查看更多>>
资源描述

《方差分析精品课程》由会员分享,可在线阅读,更多相关《方差分析精品课程(53页珍藏版)》请在金锄头文库上搜索。

1、第三章方差分析(草稿)3.1 单因素方差分析的数学模型一方面让我们看两个例子:例3.1 设甲、乙、丙三块麦田的基本苗数(按面积大小抽取样本点数)得表3.1,问三块地的基本苗数与否有明显差别?表3.1三块麦田的基本苗数甲乙丙2120242925222425282223252529213031262724.2626.20.21.例3.2为了研究淬火温度和等温温度对铣刀硬度的影响三种不同淬火温度和三种等温温度淬火,测得铣刀平均硬度如表3.2,检查淬火温度及等温温度与否对硬度y有明显影响。 表3.2 淬火温度与等温温度对硬度的影响淬火温度等温温度B1B2B3A1646668A2666867A36567

2、68这两个例子和此前回归分析的问题不同一方面,它们都只考察某种因素(地块、淬火温度、等温温度)在一系列实验中对产品某个指标(寿命、得率)的影响与否明显,而不规定建立回归方程;另一方面,这些因素可以不是定量的(如地块),即或这些因素是定量(如淬火温度与等温温度)但其数值也不作为回归中变量的观测值,而只是代表一种解决(实验方案);最后,当因素拟定后,可以作反复的实验。这两个例子和此前均值假设检查也不同,均值假设检查不考虑因素问题,而方差分析要考虑。 在许多科学研究中都遇到和这两个例子类似的问题。特别是科学研究中常波及许多因素,例如研究作物栽培时,要考虑播种期、品种、土质、施肥方式、灌溉方式对产量的

3、影响;在化学反映中要观测原料成分、剂量、催化剂、温度、压力,搅拌速度等对得率的影响。这些因素中要选出影响大的,以进一步安排更细致的实验,而判断一种因素的影响“与否大”的重要措施就是方差分析。 我们所考察的。影响产品指标的因素(如产地,温度等)也称为因子,用大写字母A,B,C表达,例1有一种因子(地块),例2有2个因子(如淬火温度与等温温度)。因素所能处的状况,如甲、乙、丙;60,65,70,75,称为因子的水平,简称为水平。例1的因子有三个水平(甲、乙、丙),例2每个因子恰也有3个水平,水平常以表达。因子也可以当作是一种变量,其取值不是数,而是水平。例如“产地”是一种变量,它取的值是“北京”、

4、“上海”、“南京”等。这种变量称为属性变量,定性变量或分类变量本节只讨论一种因子,即一种分类变量的方差分析单因子方差分析。方差分析的目的在于找出自变量与因变量之间的线性关系,或自变量对因变量的实验效果。这种实验效果可分为:主效果、交互效果、镶嵌效果。Qualitative Variable(自变量,又称独立变量、定性变量),Classification Variable(分类变量,其数值多半是不持续的。Response Variable(因变量,又称反映变量,其数值则是持续的)一般地,假设因素A有k个水平:。第j个水平做实验次,得指标y,的个数据。例3.1中。一般作如下假设:(1) 同一种水平

5、下得到的观测值,是由于实验过程中多种偶尔因素的干扰及测量误差所致,每次实验中这些偶尔因素的总和称为实验误差,它们是方差相似的零均值正态随机变量;(2) 所有误差互相独立;(3) 由于水平的不同,也许会给一种定量的拟定性的影响,其大小是未知的。于是我们建立单因子方差分析数学模型 (3.1)其中互相独立,。(4.1)式称为单因素方差分析的数学模型。 判断这个因素的影响与否明显就是要检查假设:,不全相等令 ,容易证明是的最小二乘估计 作方差分解并令,即:-总的误差平方和组内差,反映实验误差影响的大小。-组间差,反映因素A的各个水平不同引起的误差,若A的水平引起的误差明显时,就比较大,反之就比较小。则

6、有:分别称为组内差和组间差。组内差又称为误差,用以估计实验误差影响的大小;组间差反映因素A的水平不同引起的系统差别。若A的水平不同引起的系统差别(即组间的差距)明显时,SSA就比较大;反之,当A引起的系统差别不明显时,SSA就比较小而SSE重要是由实验误差引起的。SSA由k个平方之和形成,但有一种恒等式约束,只有k-1个自由度;同理SSE有n-k个自由度。下列定理给出SSA/SSE的分布定理: 对于所给的模型,若成立时,则 如果F的值超过临界值(一般取为),就否认;当F超过时,就称为高度明显。当成立时,F的值不应太大,若F的值不小于临界值时,就应否认,即觉得间存在明显差别。一般总用方差分析表表

7、达计算成果,其形式为:方差来源平方和自由度均方F值临界值因素AK-1F误差N-K总和N-1 3.2 方差分析的计算方差分析的计算一般都很复杂,可用SAS软件计算。SAS中有GLM,ANOVA和NESTED等过程可用方差分析。其中GLM过程和ANOVA最常用。3.2.1 PROC ANOVAPROC ANOVA 执行对均衡数据的方差分析,其应变量取持续值。所谓均衡数据是指对每个类变量的组合有同样多的响应变量观测值数。如果数据的非均衡的就要用PROC GLM,做方差分析。 ANOVA的语法为: PROC ANOVA DATA= SAS-data-set MANOVA MULTIPASS OUTST

8、AT= SAS-data-set; CLASS variables; /* required */ MODEL dependents=effects / options; /* required */ ABSORB variables; BY variable-list; FREQ variable; MANOVA H= effects E= effect M= equations. MNAMES= names PREFIX= name / options; MEANS effects / options; REPEATED factorname levels(levelvalues) tra

9、nsformation / options;TEST H= effects E= effect;其中PROC ANOVA、CLASS variables和MODEL dependents=effects / options是必须的。CLASS variables给出分类变量名,这些变量可以是数值的也可以是字符型的,并且CLASS必须在MODEL语句之前。 MODEL dependents=effects ,给出应变量和自变量。其后有若干选项。322 PROC GLMPROC GLM 用最小二乘法拟合线性模型。该过程可以用来做回归、方差分析、协方差分析等。PROC GLM是在广义线性模型的框架下

10、分析数据。解决的数据可以是类变量、离散变量或持续变量。其只要功能是: A、simple regression B、 multiple regression C、 analysis of variance (ANOVA), especially for unbalanced data D、 analysis of covariance E、response-surface models F、weighted regression G、 polynomial regression H、 partial correlation I、 multivariate analysis of variance

11、 (MANOVA) J、repeated measures analysis of variance. 其语法为: PROC GLM options ; CLASS variable-list; MODEL dependents= independents / options; /* required */ ABSORB variable-list; BY variable-list; FREQ variable; ID variable-list; WEIGHT variable; CONTRAST label effect values. / options; ESTIMATE label

12、 effect values. / options; LSMEANS effects / options; MANOVA H= effects E= effect M= equations. MNAMES= names PREFIX= name / options; MEANS effects / options; OUTPUT OUT= SAS-data-set keywords= names. ; RANDOM effects / options; REPEATED factorname levels (levelvalues) transformation / options;TEST

13、H= effects E= effect / options;其中PROC GLM options 、CLASS variable-list、MODEL dependents= independents /是必须的。 MODEL dependents= independents 的选项有:NOINT INTERCEPT NOUNI SOLUTION TOLERANCE E E1 E2 E3 E4 SS1 SS2 SS3 SS4 ALPHA= p CLM CLI P XPX INVERSE SINGULAR= value ZETA= value *|上述选项可分为五大类:第一类选项 与截距的界定有关,有两个选项:(1) NOINT 规定GLM将截距的参数排除在模型之外(2) INT规定GLM印出截距的记录鉴定。第二类选项 与报表的打印有关,有三个选项:(1) NOUNI(2) SOLUTION(3) TOLERANCE第三类选项与原假设的检查有关,有九个:E E1E2E3E4SS1

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号