第12章单因素方差分析

上传人:re****.1 文档编号:468731560 上传时间:2023-05-06 格式:DOCX 页数:10 大小:152.88KB
返回 下载 相关 举报
第12章单因素方差分析_第1页
第1页 / 共10页
第12章单因素方差分析_第2页
第2页 / 共10页
第12章单因素方差分析_第3页
第3页 / 共10页
第12章单因素方差分析_第4页
第4页 / 共10页
第12章单因素方差分析_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《第12章单因素方差分析》由会员分享,可在线阅读,更多相关《第12章单因素方差分析(10页珍藏版)》请在金锄头文库上搜索。

1、第 12 章 方差分析 ( Analysis of Variance )方差分析是鉴别各因素效应的一种有效统计方法,它是通过实验观察某一种或多种因素 的变化对实验结果是否带来显著影响,从而选取最优方案的一种统计方法。在科学实验和生产实践中,影响一件事物的因素往往很多,每一个因素的改变都有可能 影响产品产量和质量特征。有的影响大些,有的影响小些。为了使生产过程稳定,保证优质 高产,就有必要找出对产品质量有显著影响的那些因素及因素所处等级。方差分析就是处理 这类问题,从中找出最佳方案。方差分析开始于本世纪20年代。1923年英国统计学家R.A. Fisher首先提出这个概念, (ANOVA)。因当

2、时他在Rothamsted农业实验场工作,所以首先把方差分析应用于农业实 验上,通过分析提高农作物产量的主要因素Fisher1926年在澳大利亚去世。现在方差分析 方法已广泛应用于科学实验,医学,化工,管理学等各个领域,范围广阔。在方差分析中,把可控制的条件称为“因素”(factor),把因素变化的各个等级称为“水 平”或“处理”( treatment)。若是试验中只有一个可控因素在变化,其它可控因素不变,称之为单因素试验,否则是 多因素试验。下面分别介绍单因素和双因素试验结果的方差分析。1.1 单因素方差分析(One Way Analysis of Variance)1. 一般表达形式2.

3、方差分析的假定前提3. 数学模形4. 统计假设5. 方差分析:(1)总平方和的分解;(2)自由度分解;(3) F检验6. 举例7. 多重比较1.1.1 一般表达形式首先通过一个例子引出单因素方差分析方法。某农业科研所新培养了四种水稻品种,分 别用A1,A2, A3, A4表示。每个品种随机选种在四块试验田中,共16块试验田。除水稻 品种之外,尽量保持其它条件相同(如面积,水分,日照,肥量等),收获后计算各试验田 中产量如下表:通过这些数据要考察四个不同品种的单位产量,是否有显著性差异。类似的例子很多, 如劳动生产率差异,汽车燃油消耗,金属材料淬火温度等问题。上述问题可控实验条件是“种 子”。所

4、以种子是因素。把不同的品种A1,A2, A3, A4称为“水平” 1, 2, 3, 4表示试验批号,即每次随机的选取某个地块种某个品种的种子。称此种问题为单因素试验。 单因素试验通常分多个试验批号,目的是平衡一些不可控因素带来的影响。如土地的基 本条件不一样。如各品种只试验一次,必然在试验结果中含有不可控因素带来的影响。在众多的数据中,怎样判别不同品种的水稻产量是否存在显著性差异?初步观察A品种的产量可能低一些, A3, A4 的产量可能高一些。这是从平均数上观察。若按前面介绍的 两个总体的比较,需要作C24= 6次检验。比较麻烦,所以需要方差分析方法。 首先从数学上给出这类问题的一般形式(单

5、因素)这表明该可控因素共有k个水平,每个水平都进行m次试验,某个水平上的m次试验 可当作一个样本看待。X订表示第i个水平上第j次试验的结果。很容易看出当水平只有2个时,这相当于两个总体的均值的显著性检验问题。现在的目 的是要分析各个水平上的均值是否有显著性差异。1.1.2方差分析的假定前题(1) 每个水平(A.)上的随机变量X.的分布都是正态的,即服从N(2)。但.,iiii(i = 1,., m),2未知。每个水平上的一系列观测值,看作是取自该水平正态总体的一个容量为m的样本。(2) 认为k个水平上的k个总体方差相等,都是2 (方差齐性)。(3) 观测值X,.相互独立。i j这三个假定在实际

6、中一般都能得到满足。1.1.3数学模型因为X. .N(2),(i = 1,k)所以可以把观测值X.分解为两部分,即i jii jX. =.+ e. , (i = 1,., k) , (. = 1, 2, m)i jii j其中e.表示X.对.的随机偏差。为便于比较水平不同对X.造成的影响,可以把.也分 i ji jii ji解成两部分.=+.(i = 1, k)ii其中 =1丈卩,称为总平均(Grand mean),.称为A.水平上的效应,它满足.=k iiii0把.代入上式则有:IXij =+i + eij,i = 0,(i 2,,k)52,m)eij表示随机变量,.表示水平变量。这就是单因

7、素方差分析的数学模型。 I1.1.4 统计假设:N( ,2)。所以对应的零假设是若可控因素的不同水平对试验结果无显著性影响,那么观测值X.应该来自同一正态总 .j 体, X.i .不全相等或.不全为零。IIH0:叫:当H0成立时,样本的行平均数X必然差异不大,差异表现为随机误差,当比为真时, 0i1X间必存在较大差异,这时差异表现为系统误差。i1.1.5 方差分析方法 为判别不同水平对试验结果有无显著性影响,关键是把观测值变量中的随机误差和系统 误差分开,并能进行比较,问题就解决了。(1)分解总离差平方和(Total Sum of Squares),k m st = 22 (X. - X)2T

8、iji=1 j=1方法是在S公式中加入行平均数Xi。st = 22 ( x X)2i =1 . =1ijkm=乙乙(X.i=1 j =1ij-X.) + (X. - X)2II=为另(X,.i=1 j=1ijk mX )2 +乙乙 ii=1 j=1(X X )2 + 22k 2m(X X,)(X - X)i i. i ii=1 .=1因为(x. -X.)(X. -X)=为(x. -X)2(x. ij i ii=1 .=1i=1j=1一 X.)= 0 iji所以Sf =22 (X X)2 =22 (X X )2 iji i=1 j=1Ti=1 j=1ij、m + 22 (X - X)2ii =1

9、 . =1SE = 22(X.- Xi)2SA = 22 (X - X)2 = 2 m(X X)2AiiST=SE+SA,其中3丁称总离差平方和,总变差。SE称样本组内离差平方和。它测量同一水平上因重复实 TE验而产生的误差。这是由于不可控因素引起的,故SE反映的是随机误差。SA称样本组间离 EA差平方和。它表示各个水平上的样本平均数X.与样本总平均数X之间离差的加权平方和。i可见不同水平上的样本差异越大,SA的值就越大。它反映的是系统误差。(2).求各离差平方和 ST,SA,SE 的自由度(Degrees of freedom),fT,fA,厶。s = 22由度。因随机变量X.j的个数是N个

10、,相互独立,但受一个约T.j.ji=1 j=1束条件。X =丄22 X约束,所以自由度为N- 1,即fT = N- 1。N.jT.=1 j =1SA = 22 (X - X)2= 2m(X - X)2的自由度。因X的个数是k个,但受条件 A . . .=1 j =1.=1X =丄2mX.约束,所以自由度为fA = k -1。.=1SE=2K 2m (x - X )2的自由度。因X.的个数为N,但受条件X = 2 X ,(i = 1,., k)E.j .j.j. =1 . =1. =1约束,所以自由度为fE = N - k。 三个自由度之间也有这样的关系。fT =f + fE,N 1=(N k)

11、+(k - 1)(3)F检验在H0成立条件下,X.服从正态分布N( ,2),又知X.相互独立,所以有0 . .22(X - X)2.2(N - 1).=i j=ib 222( x X )2S ,】iA = . =1 j=1 2b 2b 2(k- 1)22 ( x x )2.=1 j=12b 2b 2(N -k)2(n2),且X与y相互独立,则且SA, SE相互独立(证明从略)。由抽样分布一章知,若x2(n1),y厂x / nF =4 Fy / n(严2)22分布时,则有当已知SA, SE相互独立且分别服从(k- 1)和(N-k)个自由度的A E-(k -1) S /(k 1、G 2SA /(k

12、 - 1)F = A FSS /(N - k)(k-1),(N 一k)e (N k)e 7G 2有了统计量F就可以做假设检验。怎样制定判别规则?分析如下:在 H0 成立条件下,有S 工工(x X )2住(Xi X )2E( 4) = E(.) = E(=1)k 1k 1k 1无(X X )2)=m Var( X.) = m imi=m E( .=1k 1.X. )2ij i另(XSSE(十)=E(曲)=兀1 XZ (X X )21 它 口 . =-EZj m 一 1km 一 1i=1=-为 G 2 =2k.=1可见吾和占都是2的无偏估计量。所以在H0成立条件下,F=X匕应E接近1。当F值很大时

13、,说明组间均方误差,大于组内均方误差,则不能认为k个总体服从 同一个正态分布,即拒绝H。,否则接受H。这是一个单端检验问题。临界值由检验水平 确定。PF F检验步骤是:(k 一 1)(N - k)1)2)3)4)5)(k 一 1,N- k)F (k- 1,N 一 k)接受 H0F (k- 1,N 一 k)拒绝 H0按判别规则给出检验结果。建立假设H:1 =2=.=,=12k选统计量F,H0成立条件下FF(k 1)(N k)0(k - 1), (N - k)由计算临界值F判别规则:若F*若F*由样本计算F*值,:通常使用方差分析表来完成F检验。方差来源离差平方和自由度均方F值临界值F组间Sk -

14、 1S /(k 1)FAAS A /(k 一 1)(k - 1,N - k)F = AS /(N 一 k)E(单侧)组内SEN - kS /(N 十)E总和SfN - 1S /(N- 1)-TT用 Eviews 进行方差分析案例 1 国家统计局城市社会经济调查总队1996 年在辽宁、河北、山西3 省的城市中 分别调查了5 个样本地区,得城镇居民人均年消费额(人民币元)数据如下表。省12345LN (辽宁)3493.023657.123329.563578.543712.43HB (河北)3424.353856.643568.323235.693647.25SX (山西)3035.593465.072989.633356.533201.06

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号