毕业论文--方差分析

上传人:suns****4568 文档编号:82902344 上传时间:2019-02-25 格式:DOC 页数:11 大小:997KB
返回 下载 相关 举报
毕业论文--方差分析_第1页
第1页 / 共11页
毕业论文--方差分析_第2页
第2页 / 共11页
毕业论文--方差分析_第3页
第3页 / 共11页
毕业论文--方差分析_第4页
第4页 / 共11页
毕业论文--方差分析_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《毕业论文--方差分析》由会员分享,可在线阅读,更多相关《毕业论文--方差分析(11页珍藏版)》请在金锄头文库上搜索。

1、 本科学生毕业论文方差分析作 者 院 (系) 专 业 年 级 学 号 指导老师 日 期 方差分析 摘 要:方差分析是从观察变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量.本文根据不同需要把某变量方差分解为不同的部分,比较它们之间的大小并用检验进行显著性检验的方法,并且用excel解决了一些问题.关键词:单因素方差分析;双因素方差分析;组间方差;组内方差;统计量1 方差分析问题的提出假设检验主要是检验两总体的均值是否差异显著,对于多个总体均值是否差异显著的问题,如果按照每一对总体进行一次检验,显然要花费很多时间,而方差分析能一次性地检验多个总体均值是否存在显著差异.因此,

2、方差分析所提供的处理方法比两两比较的处理方法要方便很多. 例1:取一批由同种原料织成的布,用不同的染整工艺进行缩水实验,以考察不同的染整工艺对布的缩水率有无显著影响,进而可以寻找出缩水率较小的染整工艺.现有五种不同的工艺,在每一工艺下重复处理四块布,测得其缩水率数据如下表所示,试问五种不同的染整工艺的平均缩水率有无显著差异?表1 染整工艺缩水率4.36.85.26.56.16.34.24.16.58.38.68.29.38.77.210.19.58.811.48.9例2:在饲料养鸡增肥的研究中,某研究所提出三种饲料配方:是以鱼粉为主的饲料是以槐树粉为主的饲料,是以苜蓿粉为主的饲料.为比较三种饲

3、料的效果,特选24只相似的雏鸡随机均分为三组,每组各喂一种饲料,60天后观察它们的重量,试验结果如下所示:表2饲料 鸡重/g107310091060100110021012100910281107109299011091090107411221001109310291080102110221032102910482 基本概念指标:衡量试验条件好坏的变量称为指标,用y表示,它是一个随机变量.在例1中,缩水率就是试验指标. 因子:在试验中影响指标y的因素称为因子,它们常用大写字母、等来表示.在例1中染整工艺对指标缩水率有影响,因此染整工艺就是因子,记为 水平:在试验中因子所处的状态称为因子的水平,

4、用表示因子的字母加下标来表示,譬如因子的水平用等来表示.在例1中有五种染整工艺,这便是染整工艺这一因子五个水平,分别记为试验条件(也称处理):在单因子试验中,每个水平就是一个处理,在多因子试验中,每个因子取一个特定的水平,这些特定水平的组合称其为一个试验条件,又称为一个处理.3 基本假定从最简单的单因子试验问题着手,介绍在方差分析中所作的假定.假定因子有个水平,记为在水平下指标值的全体便构成一个总体,共有个总体.我们有如下假定:(1)假定第个总体服从正态分布,其均值为, (2)每一总体的方差相等,记为; (3)从第个总体获得一个容量为的样本为,且这个样本相立. 在上述三个假定下,比较各个总体的

5、均值是否相同的问题,即要检验如下假设不全相等,检验这一对假设的统计方法便是方差分析.当拒绝时,表示不同水平下的指标的均值有显著差异,此时称因子是显著的,否则称因子不显著. 4 统计模型按假定有,因此可以认为观察值与其均值的差是随机误差,从而 有如下数据结构式:由及各个相互独立,可知各相互独立,且都服从.因此可以给出如下的单因子方差分析统计的模型: 在该模型下检验的假设是:,为了推广到两因子及多因子方差分析方便起见,引入一般平均与效应的概念,如记各均值的平均为:称为一般平均,或称为总平均,又记它表示从水平的均值中除去总均值后特有的贡献,称为水平的效应,它可正可负,容易看出,诸受到约束: 这样一来

6、,统计模型可改写为, 在该模型下检验的假设可以改写为:5 基本思想5.1 平方和分解众所周知,各数据的差异程度(即波动大小)可用它们的总偏差平方和(简称总平方和)去度量:,其中为自由度.引起数据波动的原因不外有如下两个:(1)由于因子的不同水平引起的,当原假设不真时,各个水平下指标的均值(简称水平均值)不同,诸样本均值间的差异程度可用如下的偏差平方和去度量:这里乘以是为每个水平进行了次试验.这个平方和称为组间偏差平方和,又称为因子偏差平方和,简称因子平方和.(2)由于试验存在随机误差,即使在同一水平下获得的数据也会有差异,这是除因子水平外的一切原因引起的,我们将它们归结为随机误差,可以用组内偏

7、差平方和(也称为误差平方和)表示:由于考虑到交叉乘积项之和为0,故有如下总平方和分解式:5.2 均方(平均偏差平方和)与比偏差平方和Q的大小与数据个数(自由度)有关,一般说来,数据越多,其偏差平方和越大.为了便于在偏差平方和间进行比较,统计上引入了均方和的概念,它定义为,其意为平均每个自由度上有多少平方和,它比较好地度量了一组数据的离散程度.如今要对因子平方和与误差平方和之间进行比较,用其均方和进行比较更为合理,因为均方和排除了自由度不同产生的干扰.故用作为检验的统计量.如果,则认为因子显著;若,则说明因子不显著.经过简单推导,可以给出常用的各偏差平方和的计算公式如下:.6 单因子方差分析 设

8、在一个试验中只考虑一个因子,它有个水平,在每个水平下进行次重复试验,其结果用表示,常常把数据列成如表3的形式:表3水平试验数据和均值例3:某连锁商业企业在同城三个不同的地点开了三家分店,从这三家分店随机抽了5天的营业额资料如表4表4第一家分店第二家分店第三家店第一天10714第二天12118第三天9812第四天81310第五天111011试分析这三家分店的平均日营业额是否相同,从而确定地点因素是否对日均营业额有影响(),如果把每一个分店的日营业额看成一个总体,以上问题的实质是检验这三个总体的均值是否相等:,其中,分别为三分店的平均日营业额.通过excel,进行单因素方差分析,可以得到两个统计表

9、,并且得出统计量:表5方差分析:单因素方差分析组观测数求和平均方差列 1550102.5列 25499.85.7列 3555115方差分析差异源-value crit组间4.13333333322.066666670.4696970.6362153.885294组内52.8124.4总计56.9333333314由上表可得:,样本的统计量,分析表给出了临界值是,接受,即没有充分证据说明三个分店的地点不同对日均营业额产生了影响.如果直接从值进行判断,由于,结论也是接受原假设.6.1 重复数不等的方差分析例4: 某型号化油器原中小喉管的结构使油耗较大,为节约能源,设想了两种改进方案以降低油耗.油耗

10、的多少用比油耗进行度量,现在对用各种结构的中小喉管制造的化油器分别测定其比油耗,数据如下.假定每一种结构下的比油耗服从等方差的正态分布,试问中小喉管的结构对平均比油耗的影响是否显著.表6水平:原结构11.012.87.68.34.75.59.310.3:改进方案12.84.5-1.50.2:改进方案24.36.11.43.6现在对这些数据做方差分析用excel,有下表7表7方差分析:单因素方差分析组观测数求和平均方差行1869.58.68757.518393行2461.57.126667行3415.43.853.776667方差分析差异源-valuecrit组间155.6456277.8228

11、111.855070.0011743.805565组内85.33875136.564519总计240.984415设,从分布表查得,由于求得的,所以在水平上因子是显著的,说明不同的中小喉管结构生产化油器的平均比油耗有明显的差异.6.2 各水平均值与误差方差的估计当因子是显著的,我们还可以给出每一水平均值与水平效应的估计,以便找出最好的水平.,它们都是相应参数的无偏估计,从而第个水平均值的无偏估计为误差方差的无偏估计: ,可取得的估计为.6.3 多重比较 在单因子方差分析中,若经检验拒绝原假设,这表明,因子的个水平均值不全相等,但不一定两两之间都有差异.故还需进一步去确认哪些水平均值之间确有显著

12、的差异,哪些水平之间无显著的差异.这就要进行多重比较.同时比较任意两个水平均值间有无显著差异的问题称为多重比较.这里的关键词是“同时”两字.若有r(r2)个水平均值,则同时检验以下个假设的检验就是多重比较的问题:譬如在时,多重比较问题就是要同时检验如下三个假设:直接考虑,当为真时,不应过大,过大就应拒绝.因此在同时考虑个假设时,“诸中至少有一个不成立”就构成多重比较的拒绝域,它应有如下形式:这里表示水平下数据的平均值,.对于给定的显著性水平,就要确定这样的临界值,使得上述个假设都成立时有. 7 两因子方差分析如果在一个试验中需要同时考察两个因子和,并设因子有个水平,因子有个水平,这时共有个不同

13、的试验条件,也就是说有个总体.现做如下假设: 每一个总体的分布是正太分布,其均值为,它与因子及的水平有关;其方差相等,都是. 现在我们不仅需要分析因子的不同水平对指标的均值有无显著的影响,还需要分析因子的不同水平对指标的均值有无显著的影响,有时还需要回答两个因子不同水平的搭配对指标的均值有无特殊的影响,这种特殊影响如果存在就称为因子与间有交互作用,记为或.7.1 无交互作用下的方差分析:设与是可能对试验结果有影响的两个因素,相互独立,无交互作用.设在双因素各种水平的组合下进行试验或抽样,得数据如表8:表8因素均值因素均值表中每行均值是在因素的各个水平上试验结果的平均数;表中每列的均值是在因素的各种水平上试验的平均数.以上数据的离差平方和分解形式为:上式中,表示的是因素的组间方差总和,是因素的组间方差总和,都是由各因素

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 毕业论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号