本科方差分析

上传人:gg****m 文档编号:206250729 上传时间:2021-10-30 格式:DOC 页数:17 大小:331.50KB
返回 下载 相关 举报
本科方差分析_第1页
第1页 / 共17页
本科方差分析_第2页
第2页 / 共17页
本科方差分析_第3页
第3页 / 共17页
本科方差分析_第4页
第4页 / 共17页
本科方差分析_第5页
第5页 / 共17页
点击查看更多>>
资源描述

《本科方差分析》由会员分享,可在线阅读,更多相关《本科方差分析(17页珍藏版)》请在金锄头文库上搜索。

1、本科学生毕业论文方差分析者M)业级号师期( 老导作院专年学指日方差分析摘 要:方差分析是从观察变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响 的变量.本文根据不同需要把某变量方差分解为不同的部分,比较它们之间的大小并用F检验进行显著 性检验的方法,并且用excel解决了一-些问题.关键词:单因素方差分析;双因素方差分析;组间方差;组内方差;F统计量1方差分析问题的提出假设检验主要是检验两总体的均值是否差异显著,对于多个总体均值是否差异显著的问题,如果按 照每一对总体进行一次检验,显然要花费很多时间,而方差分析能一次性地检验多个总体均值是否存在 显著差异.因此,方差分析所提供的

2、处理方法比两两比较的处理方法要方便很多.例1:取一批由同种原料织成的布,用不同的染整工艺进行缩水实验,以考察不同的染整工艺对布的缩 水率有无显著影响,进而可以寻找出缩水率较小的染整工艺.现有凡&五种不同的工艺,在每一工艺 下重复处理四块布,测得其缩水率数据如下表所示,试问7T.种不同的染整工艺的平均缩水率有无显著差 异?表1染整工艺缩水率A4.36.85.26. 5A6. 16.34.24. 1&6.58.38.68.2A9.38.77.210. 19.58.811.48.9例2:在饲料养鸡增肥的研究中,某研究所提出三种饲料配方:A是以鱼粉为主的饲料盅是以槐树粉为 主的饲料,A是以苜蓿粉为主的

3、饲料.为比较三种饲料的效果,特选24只相似的雏鸡随机均分为三组, 每组各喂一种饲料,60天后观察它们的重量,试验结果如卜所示:表2饲料鸡重/gA10731009106010011002101210091028A,1107109299011091090107411221001A109310291080102110221032102910482基本概念指标:衡量试验条件好坏的变量称为指标,用y表示,它是一个随机变量.在例1中,缩水率就是 试验指标.因子:在试验中影响指标y的因素称为因子,它们常用大写字母A、B、。等来表示.在例1中染 整工艺对指标缩水率有影响,因此染整工艺就是因子,记为A水平:在试

4、验中因子所处的状态称为因子的水平,用表示因子的字母加下标来表示,譬如因子A的水平用4,总等来表示.在例1中有五种染整工艺,这便是染整工艺这一因子五个水平, 分别记为A,4, a a A试验条件(也称处理):在单因子试验中,每个水平就是一个处理,在多因子试验中,每个因子取 一个特定的水平,这些特定水平的组合称其为一个试验条件,乂称为一个处理.3基本假定从最简单的单因子试验问题着手,介绍在方差分析中所作的假定.假定因子A有个厂水平,记为 劣,人,.在水平下指标值的全体便构成一个总体,共有尸个总体.我们有如卜假定:(1) 假定第,个总体服从正态分布,其均值为(2) 每一总体的方差相等,记为(3) 从

5、第,个总体获得一个容量为m的样本为无,)如,),= 1,2,.,尸,,且这/个样本相立.在上述三个假定下,比较各个总体的均值是否相同的问题,即要检验如下假设 HoW = 2 =. = Hr,H :h%,r不全相等,检验这一对假设的统计方法便是方差分析.当拒绝 H。时,表示不同水平下的指标的均值有显著差异,此时称A因子是显著的,否则称因子不显著.4统计模型按假定有yjN(y),因此可以认为观察值舄与其均值丹的差是随机误差勺,从而坊有如下数据结构式:)勺=/J( +勺J = 1,2,.r,j = 1,2,.m由N(%q),及&.各个相互独立,可知JJJJ各勺相互独立,且都服从N。,成).因此可以给

6、出如下的单因子方差分析统计的模型:Jy =R +勺,7= 1,2,./ = 1,2,.,,各勺相互独立.同分布于N (0, cr2)在该模型下检验的假设是:H:h = m =. = r,H:,%,总不全相等,为了推广到两因子及多 因子方差分析方便起见,引入一般平均与效应的概念,如记各均值的平均为:质杖从称为一 般平均,或称为总平均,乂记 =-=1,2,.,尸它表示从水平A,的均值中除去总均值后特有的贡 献,称为水平4的效应,它可正可负,容易看出,诸q.受到约束:y.=0这样一来,统计模型可改写为,/=i=0/=!各勺相互独立同分布于N(O,cr2)在该模型下检验的假设可以改写为:H。: =.

7、= % =0,凡不全为05基本思想5. 1平方和分解众所周知,n = nn各数据的差异程度(即波动大小)可用它们的总偏差平方和(简称总平方和)S.2去度量:ST= ().-) , fT=n-l其中启为自由度.引起数据波动的原因不外有如下两个:/=! J=1 (1电于因兰的不同水平引起的,当原假设不真时,各个水平下指标的均值(简称水平均值)不同, 诸a,2,a样本均值间的差异程度可用如下的偏差平方和去,度量:r-1这里乘以力是为每个水平进行了 m次试验.这个平方和称为组间偏差平54=初(月一分,有=/=!方和,乂称为因子A偏差平方和,简称因子A平方和.(2)由于试验存在随机误差,即使在同一水平卜

8、获得的数据也会有差异,这是除因子*水平外的一切 原因引起的,我们将它们归结为随机误差,可以用组内偏差平方和(也称为误差平方和)S,表示:/_2rm _ 2 尸”I / /-.nSa =眼3 - y),刀=。1 由于 Sr (坊-V)+ (月-y)/=1/=1 j=i=l j= LJ乘积项之和为0,故有如下总平方和分解式:厂时+) =()勺-项)+1(云一5) =Se+S,/=! j=lt=l j=l1=1 j=l/=!2,考虑到交又Z=1 j=1=1 j=l5.2均方(平均偏差平方和)与F比偏差平方和Q的大小与数据个数(白由度)有关,一般说来,数据越多,其偏差平方和越大.为了 便于在偏差平方和

9、间进行比较,统计上引入了均方和的概念,它定义为,MS = Q/fQ其意为平均每个 日由度上有多少平方和,它比较好地度量了一组数据的离散程度.如今要对因子平方和与误差平方和之 间进行比较,用其均方和MSa = SA / fA,MSe = S,/尤进行比较更为合理,因为均方和排除了自由度不 同产生的干扰.故用/ = 些=君乙作为检验的统计量.如果F Nj),贝U认为因子A显著;若F12,Vim1A)21也2)1,)2Cm?T,例3:某连锁商业企业在同城三个不同的地点开了三家分店,从这三家分店随机抽了 5天的营业额资料 如表4表4第家分店第二家分店第三家店第天10714第二天121 1S第三天981

10、2第四天81310第五天1 11011试分析这三家分店的平均日营业额是否相同,从而确定地点因素是否对日均营业额有影响(a =0.05 ), 如果把每一个分店的日营业额看成一个总体,以上问题的实质是检验这三个总体的均值是否相等: Hq=R=f=%H;hf,3三者不全相等,其中,分别为三分店的平均日营业额.通过excel,进行单因素方差分析,可以得到两个统计表,并且得出F统计量:表5明三个分店的地点不同对日均营业额产生了影响.如果直接从P值进行判断,由于 P值=0.636215 0.05 ,结论也是接受原假设.6.1重复数不等的方差分析例4:某型号化汕器原中小喉管的结构使汕耗较大,为节约能源,设想

11、了两种改进方案以降低汕耗.汕 耗的多少用比汕耗进行度量,现在对用各种结构的中小喉管制造的化汕器分别测定其比汕耗,数据如下. 假定每一种结构下的比油耗服从等方差的正态分布,试问中小喉管的结构对平均比油耗的影响是否显 著.表6水平A1:原结构11,012.87. 6S. 34.75.59. 310. 3A:改进方案1 Av2.84.5-1. 50.2改进方案24.36. 11.43.6现在对这些数据做方差分析用excel,有下表7表7方差分析:单因素方差分析组观测数求和平均方差行1869.58.68757.518393行2461.57.126667行3415.43.853.776667方差分析差异

12、源SSdfMSFP -valueF crit组间155.6456277.8228111.855070.0011743.805565组内85.33875136.564519总计240.984415设a = 0.05,从F分布表查得95(2,13) = 3.81 ,由于求得F3.81的,所以在水平上因子A是显著 的,说明不同的中小喉管结构生产化汕器的平均比汕耗有明显的差异.6.2各水平均R值与误差方差的估计当因子A是显著的,我们还可以给出每一水平均值丹与水平效应的估计,以便找出最好的水平它们都是相应参数的无偏估计,从而第i个水平均值的无偏估计为误差方差的无偏估计:72 = MSe ,可取得b的估计

13、为7 = J还.6.3多重比较在单因子方差分析中,若经F检验拒绝原假设H萨=出=; = ,这表明,因子A的尸个水 平均值不全相等,但不一定两两之间都有差异.故还需进一步去确认哪些水平均值之间确有显著的差异, 哪些水平之间无显著的差异.这就要进行多重比较.同时比较任意两个水平均值间有无显著差异的问题称 为多重比较.这里的关键词是“同时”两字.若有r(r2)个水平均值缶的.,则同时检验以下(;)个假设的检验就是多重比较的问题:11=叩 j,i,j = l,2,.,r譬如在,二3时,多重比较问题就 是要同时检验如下三个假设H= %H,、= %H*.=冉:直接考虑,当 况为真时,y.-yj不应过大,过大就应拒绝玳.因此在同时考虑(;)个假设时,“诸 研 中至少有一个不成立”就构成多重比较的拒绝域,它应有如下形式:w=u旧一元J这里项表示A水平下数据的平均值,i = l,2,.,r.对于给定的显著性水平,就要确定这样的临界值勺,使得上述(;)个假设都成立时有 p(W) = a.7两因子方差分析如果在一个试验中需要同时考察两个因子A和8,并设因子A有

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号