第一节 单因素试验的方差分析

上传人:鲁** 文档编号:510309893 上传时间:2023-12-30 格式:DOCX 页数:8 大小:38.52KB
返回 下载 相关 举报
第一节 单因素试验的方差分析_第1页
第1页 / 共8页
第一节 单因素试验的方差分析_第2页
第2页 / 共8页
第一节 单因素试验的方差分析_第3页
第3页 / 共8页
第一节 单因素试验的方差分析_第4页
第4页 / 共8页
第一节 单因素试验的方差分析_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《第一节 单因素试验的方差分析》由会员分享,可在线阅读,更多相关《第一节 单因素试验的方差分析(8页珍藏版)》请在金锄头文库上搜索。

1、第八章方差分析与回归分析第一节单因素试验的方差分析在科学试验、生产实践和社会生活中,影响一个事件的因素往往很多。例如,在工业生 产中,产品的质量往往受到原材料、设备、技术及员工素质等因素的影响;又如,在工作中, 影响个人收入的因素也是多方面的,除了学历、专业、工作时间、性别等方面外,还受到个 人能力、经历及机遇等偶然因素的影响 虽然在这众多因素中,每一个因素的改变都可能影 响最终的结果,但有些因素影响较大,有些因素影响较小故在实际问题中,就有必要找出 对事件最终结果有显著影响的那些因素.方差分析就是根据试验的结果进行分析,通过建立 数学模型,鉴别各个因素影响效应的一种有效方法.分布图示基本概念

2、例2假设前提偏差平方和及其分解方差分析的任务检验方法习题8-1内容要点一、基本概念在方差分析中,我们将要考察的对象的某种特征称为试验指标.影响试验指标的条件称 为因素.因素可分为两类,一类是人们可以控制的(如上例的原材料、设备、学历、专业等 因素);另一类人们无法控制的(如上例中员工素质与机遇等因素).今后,我们所讨论的因素都是指可控制因素。因素所处的状态,称为该因素的水平如 果在一项试验中只有一个因素在改变,则称为单因素试验;如果多于一个因素在改变,则称 为多因素试验.为方便起见,今后用大写字母A,B,C,等表示因素,用大写字母加下标表示 该因素的水平,如气,A2,等.二、假设前提设单因素A

3、具有r个水平,分别记为 A2,., A,在每个水平A,(i 1,2,.,r)下,要考 察的指标可以看成一个总体,故有r个总体,并假设:(1) 每个总体均服从正态分布;(2) 每个总体的方差相同;(3)从每个总体中抽取的样本相互独立.那么,要比较各个总体的均值是否一致,就是要检验各个总体的均值是否相等,设第 个总体的均值为耳,则假设检验为H0 :鸟=% 日.备择假设为H 1:七七,四不全相等通常备择假设可以不写.在水平气( = 1,2, ,r)下,进行气次独立试验,得到试验数据为X,., 乂设, X*,记数据的总个数为n = n .i=1由假设有XjjN (, q 2)(%和b2未知),即有Xj

4、j -耳N (0, C 2),故Xjj -耳可视为 随机误差.记乂订-七=%,从而得到如下数学模型:I X 目=%, +% , = 1,2,r, j = 1,2,n .()|N(0q 2),各个8相互独立,%和。2未知I ji方差分析的任务:1)检验该模型中r个总体N(% q2)( . = 1,2,.,r)的均值是否相等;I2)作出未知参数四,四2,,巴,c2的估计.为了更仔细地描述数据,常在方差分析中引入总平均和效应的概念.称各均值的加权平 均% =1 n 四, n =1为总平均.其中n= n .再引入I=18 . = % %, i = 1,2,r,8,表示在水平A下总体的均值.与总平均的差

5、异,称其为因子A的第i个水平A.的效应. 易见,效应间有如下关系式:n (%.一%) = 0,I I利用上述记号,前述数学模型可改写为X 订 + 8 i + j , i = 1,2, ,,, r, j = 1,2, ,,, nr(2)Z ni8 i - 0i=1N(0,b 2),各个相互独立,日和b2未知(ijiji而前述检验假设则等价于:H : 81 = 8 2 =S .H1: 8 :, 82,:.,8不全为零.三、偏差平方和及其分解为了使造成各X之间的差异的大小能定量表示出来,我们先引入:记在水平下数据和记为:Xj=x.,其样本均值为X=-N, iji.j=1X,因素A下的所 ijj=1有

6、水平的样本总均值为x=; Xi=1 j=11 v x.,r 旗i=1为了通过分析对比产生样本Xij=1,2,,j = 1,2,,k之间差异性的原因,从而确定因素A的影响是否显著,我们引入偏差平方和来度量各个体 间的差异程度:(3)st = ( x - X )2i=1 j=1*能反映全部试验数据之间的差异,又称为总偏差平方和.如果气成立,则,个总体间无显著差异,也就是说因彩对指标没有显著影响,所有 的X可以认为来自同一个总体N(日q2),各个X间的差异只是由随机因素引起的。若H0 不成立,则在总偏差中,除随机因素引起的差异外,还包括由因素A的不同水平的作用而产 生的差异,如果不同水平作用产生的差

7、异比随机因素引起的差异大的多,就认为因素A对指 标有显著影响,否则,认为无显著影响为此,可将总偏差中的这两种差异分开,然后进行 比较。记(4)其中 5 = n (X. - X)2, 5 = (X. - X )2.Ai Eij l.i=1i=1 j=15人反映在每个水平下的样本均值与样本总均值的差异,它是由因素A取不同水平引起 的,称为组间(偏差)平方和,也称为因素A的偏差平方和.5表示在水平A,下样本值与该水平下的样本均值之间的差异,它是由随机误差引起 的,称为误差(偏差)平方和,也称为组内(偏差)平方和.等式st = sa + %称为平方和分解式.事实上S = EX (X - X)2= EX

8、 (X - X.) + (X. - X)2Tijij L 1-i=1 j=1i=1 j=1w . 一一 w . 一.寸=EE (X - X. )2+2ee (X - X.)(X - X) +E n (X - X )2,iji.ij1- i.i i.i=1 j=1i=1 j=1i=1根据可和X的定义知vV ni , , -EE (Xq - X.)( X. - X) = 0, i=1 j=1所以ST = Ee (Xjj - X. )2 +E n (X- X )2 = SE + Sa .i=1 j=1i=1四、SE与Sa的统计特性如果H0成立,则所有的Xjj都服从正态分布N(四q2),且相互独立,由

9、第五章第三节 的定理,可以证明:1) S 2 z 2(n -1);1 t2) Se /b2-z 2(n -r),且E(Se) =EEX泌c 2.所以 Se/(n - r)为 c 2的无不偏j=1 k=1估计.3) Sa /c 2 z 2(r -1),且 E(Sa ) = (r-1)c 2,因此 S(r -1)为 c 2 的无偏估计.4) Se与Sa相互独立.五、检验方法如果组间差异比组内差异大的多,即说明因素的各水平间有显著差异,r个总体不能认 为是同一个正态总体,应认为H不成立,此时,比值冬二冬 有偏大的趋势.为此,选用0(r -1)Se统计量F = SA(r - 1) =(n - r)SA

10、S(n - r)(r -1)SEE在H。为真时,有尸=虹冬F(r -1,n - r).对给定的检验水平a,查F (r -1, n - r)的值,由样本观察值计算Se , Sa,从而计算出统计量F的观察值.由于H0不真时,SA值偏大,导致F值偏大.因此,1) 若F Fa(r-1, n - r)时,拒绝H0,表示因素A的各水平下的效应有显著差异;2) 若F Fa (r -1, n - r)时,则接受H0,表示因素A的各水平下的效应无显著差异.实际分析中,常采用如下简便算法和记号:T = 2x.,i = 1,2,i-nj=1 x.ijii=1 j=1i=1s广Xj三,昭-令斗- i=1 j=1i=1

11、 i为表达的方便和直观,将上面的分析过程和结果制成一个表格,称这个表为单因素方差 分析表:表8-1B单因素方差分析表方差来源平方和自由度均方和F值因素人SAr 1SMSa = A-ms F = ams误差ESEn rSMSe =厂E总和TS Tn 1例题选讲例1 (E01)设有三台机器,用来生产规格相同的铝合金薄板.取样,测量薄板的厚度精确 至千分之一厘米.得结果如下表所示.铝合金板的厚度机器I机器II机器III0.2360.2570.2580.2380.2530.2640.2480.2550.2590.2450.2540.2670.2430.2610.262这里,试验的指标是薄板的厚度,机器

12、为因素,不同的三台机器就是这个因素的三个不 同的水平.如果假定除机器这一因素外,材料的规格、操作人员的水平等其它条件都相同, 这就是单因素试验.试验的目的是为了考察各台机器所生产的薄板的厚度有无显著的差异, 即考察机器这一因素对厚度有无显著的影响.如果厚度有显著差异,就表明机器这一因素对 厚度的影响是显著的.例2 (E02)某食品公司对一种食品设计了四种新包装.为了考察哪种包装最受欢迎,选 了十个有近似相同销售量的商店作试验,其中两种包装各指定两个商店销售,另两种包装各 指定三个商店销售.在试验期中各商店的货架排放位置、空间都尽量一致,营业员的促销方 法也基本相同.观察在一定时期的销售量,数据

13、如下表所示:销售量包装商店商店数ni123a112182a21412133a31917213a424302在本例中,我们要比较的是四种包装的销售量是否一致,为此把包装类型看成是一个因 子,记为因子A,它有四种不同的包装,就看成是因子A的四个水平,记为A1,气,气,气.一般 将第/种包装在第j个商店的销售量记为%,i = 1,2,3,4; j = 1,2,气(在本例中,n1 = 2, n2 = 3, n3 = 3, n4 = 2).由于商店间的差异已被控制在最小的范围内,因此一种包装在不同商店里的销售量被 看作为一种包装的若干次重复观察,所以可以把一种包装看作一个总体.为比较四种包装的 销售量是

14、否相同,相当于要比较的四个总体的均值是否一致.简化起见,需要给出若干假定, 把所要回答的问题归结为下个统计问题,然后设法解决它.例3 (E03)在例1中,检验假设(a = 0.05)H :日=日=日,H :日,日,日不全相等.01 r 23 IlU解 这里 r = 3,气=% = % = 5, n = 15,$ 5T2,3.82St =险X -一 = 0.963912 -右=0.00124533,i=1 j=1Sa = T T2 =上(1.212 +1.282 +1.312) 3.82i5 = 0.00105333, i=1 ninSe = St Sa = 0.000192.St,Sa,Se的自由度依次为n 1 = 14, r 1 = 2, n r = 12,得方差分析表如下:方差来源平方和自由度均方和F比因素误差0.001053330.0001922120.0005266

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号