方差分析与正交实验设计

上传人:宝路 文档编号:48257154 上传时间:2018-07-12 格式:PPT 页数:151 大小:1.29MB
返回 下载 相关 举报
方差分析与正交实验设计_第1页
第1页 / 共151页
方差分析与正交实验设计_第2页
第2页 / 共151页
方差分析与正交实验设计_第3页
第3页 / 共151页
方差分析与正交实验设计_第4页
第4页 / 共151页
方差分析与正交实验设计_第5页
第5页 / 共151页
点击查看更多>>
资源描述

《方差分析与正交实验设计》由会员分享,可在线阅读,更多相关《方差分析与正交实验设计(151页珍藏版)》请在金锄头文库上搜索。

1、第四章 方差分析与正交试验设计教学目的与要求:复习方差分析的主要内容,了 解正交实验设计的基本内容,掌握各种不同的 正交试验设计的数据分析方法。 要求学生初步掌握统计质量控制的含义,掌握 相关理论。 重点与难点:本章的重点是无交互作用的正交 试验设计与数据分析,难点是有交互作用的正 交试验设计与数据分析。 所需课时:4+2本章主要内容41 方差分析(略) 42 正交试验的基本概念与正交表 43 无交互作用的正交设计与数据分析 44 有交互作用的正交设计与数据分析 45 有重复试验的情况 46 水平数不等的试验设计与数据分析 47 筛选试验 48 多指标的数据分析 49 饱和设计第一节 方差分析

2、所谓方差分析,是通过比较因素的方差与试验误差的 方差,来检验因素对试验指标的影响是否显著。其 实质是假设多个总体方差相等的情况下,判断它们 的均值是否相等。也就是将试验数据的总波动平方 和分解成各因素和交互作用以及试验误差的波动平 方和,并比较它们的方差,以判断因素影响的显著 性。 方差分析(Analysis of Variance,简称ANOVA)能够 解决多个均值是否相等的检验问题。节省时间是这 种方法明显的优点,它的另一个好处是,由于进行 分析时是将所有的样本资料结合在一起,因而增加 了稳定性。例如,有30个样本,每一个样本包括10 个观察单位。如果用T检验法,一次只能研究两个样 本,2

3、0个观察单位,而使用方差分析则可以把300个 观察单位结合在一起进行研究。所以说,方差分析 是一种实用、有效的分析方法。方差分析是一种因 素分析方法,广泛应用于优化设计、理化分析、绩 效考核中。(一)方差分析的内容方差分析是对多个总体均值是否相等这一假设进行检验。下面通 过一个例子说明方差分析的内容。 例4-1某饮料生产企业研制出一种新型饮料。饮料的颜色共有 四种,分别为橘黄色、粉色、绿色和无色透明。随机从五家超 级市场上收集了前一期该种饮料的销售量,如表4-6所示。问 饮料的颜色是否对销售量产生影响。表46该饮料在五家超市的销售情况这是一个方差分析问题。即对四种饮料销售量均值 是否相等进行检

4、验。由于饮料是同一厂家生产的 ,它们的营养含量、味道、价格、装潢等可能影 响销售量的因素全部相同,如果检验结果为1、 2、3、4不相等,如图4-5(a)所示,则意 味着它们来自于不同的总体,表明饮料颜色对销 售量产生影响。反之,如果检验结果为1、2、 3、4不存在显著影响,则可以认为饮料的颜色 对销售量没有影响,它们来自于相同的总体。见 图45 (b)。图4-5(a)不同总体的情况 图45(b)相同总体的情况在方差分析中,常常用到一些术语。一个是因素,因素是 一个独立的变量,也是方差分析研究的对象。在前面的 例子中,饮料的颜色就是一个因素。因素中的内容称为 水平。上例因素中的水平有四个,即饮料

5、的四种不同颜 色。如果方差分析只针对一个因素进行,称为单因素方 差分析。如果同时针对多个因素进行,称为多因素分析 。在多因素方差分析中,双因素方差分析是最常见的。 在方差分析中,通常假定各个水平的观察数据是来自于 服从正态分布总体中的随机样本,各个总体相互独立, 且方差相同。实际应用中严格地满足这些假定,特别是 对社会经济现象的分析,确实过于苛刻。但一般应近似 地符合上述要求。(二)方差分析的原理从方差分析的目的看,是要检验各个水平的均 值1、2、3、4是否相等,而实现这个 目的的手段是通过方差的比较。观察值之间 存在着差异,差异的产生来自于两个方面, 一个方面是由因素中的不同水平造成的,例

6、如饮料的不同颜色带来不同的销售量,对此 我们可以称为系统性差异;另一个方面是由 于抽选样本的随机性而产生的差异,例如, 相同颜色的饮料在不同的商场销售量也不同 。两个方面产生的差异可以用两个方差来计 量,一个称为水平之间的方差,一个称为水 平内部的方差。前者既包括系统性因素,也 包括随机性因素。后者仅包括随机性因素。如果不同的水平对结果没有影响,如前例饮料的 颜色对销售量不产生影响,那么在水平之间的 方差中,就仅仅有随机因素的差异,而没有系 统性差异,它与水平内部方差就应该近似,两 个方差的比值就会接近于1;反之,如果不同的 水平对结果产生影响,在水平之间的方差中就 不仅包括了随机性差异,也包

7、括了系统性差异 。这时,该方差就会大于水平内方差,两个方 差的比值就会显著地大于1许多,当这个比值大 到某个程度,或者说达到某临界点,就可以作 出判断,说不同的水平之间存在着显著性差异 。因此,方差分析就是通过不同方差的比较, 作出接受原假设或拒绝原假设的判断。(三)F分布水平间(也称组间)方差和水平内(也称组内 )方差之比是一个统计量。数理统计证明, 这个统计量服从F分布(F Distribution)。 F分布有这样几个特征: 统计量F是大于零的正数。 F分布曲线为正偏态,它的尾端以横轴为渐 进线趋于无穷。 F分布是一种连续的概率分布,不同的自由 度组合有不同的F分布曲线,如图4-6所示:

8、也就是将试验数据的总波动平方和分解成各因素 和交互作用以及试验误差的波动平方和,并比 较它们的方差,以判断因素影响的显著性。方 差分析是一种因素分析方法,广泛应用于优化 设计、理化分析、绩效考核中。其具体步骤如 下: (1)统计模型; (2)平方和分解; (3)F比; (4)计算。 4、最佳条件的选择与对应条件下指标均值的估计 。 (四)绘制效应图 (五)验证实验图4-6 不同自由度下F分布曲线由上图可以看出,随着分子和分母自由度的增加,F分布以对称的 正态分布为极限。许多类型的假设检验需要利用F分布,方差分析 是其中的重要一种。二、单因素方差分析(一)单因子试验 例: 茶是一种饮料,它含有叶

9、酸(folacin),这是 一种维他命B。如今要比较各种茶叶中的叶酸含量 。 现选定绿茶,这是一个因子,用A表示。 又选定四个产地的绿茶,记为A1, A2, A3, A4,它 是因子A的四个水平。 为测定试验误差,需要重复。 各水平重复数相等的设计称为平衡设计. 各水平重复数不等的设计称为不平衡设计. 如今我们选用不平衡设计,即A1, A2, A3, A4分别 制作了7,5,6,6个样品,共有24个样品等待测试。这里一次测试就是一次试验。试验次序要随机化,为此把这 24次试验按序编号。 这里一次测试就是一次试验。 试验次序要随机化,为此把这 24次试验按序编号。在1到24个试验号中一个接一个地

10、随机抽取,得到如下序 列: 9,13,2,20,18,10,5,7,14,1,6,15,23,把试验结果“对号入座”,填写试验结果。四个产地绿茶叶酸含量的打点图(dotplot)四个产地绿茶叶酸含量的打点图(dotplot) 图上表示叶酸含量,线表示样本均值。下述一些直 观的印象是重要. 图中每种绿茶的叶酸含量有高有低. 从样本均值看,A1与A2的叶酸含量偏高一些. 从样本极差看, A1,A2 ,A3 的极差接近, A4的略 小一点。(二)单因素方差分析的步骤 由前面的内容和例子可知,不同水平下销售量x的概率分布服从 正态分布,并且有相同方差。因此,水平的差异必然体现在水平 均值的差异上。于是

11、作为单因素的方差分析,其目标是检验水平 均值j是否相等。如果相等,我们说该因素(如前例中饮料的颜 色)对x不产生影响;反之,就认为该因素对x存在影响。 为便于叙述,也便于理解,可以将方差分析按其过程划为几步。 1、计算水平均值 不妨令 表示第j种水平的样本均值, 式中,是第j种水平下的第i个观察值,nj表示第j种水平的观 察值个数。 结合前面表4-6中的数据,将计算结果列表4-7如下: 下表中,计算总均值的一般表达式为 式中,n=nj表47 四种颜色饮料销量及均值 2、计算离差平方和 在单因素方差分析中,离差平方和有三个,它们 分别是总离差平方和,误差项离差平方和以及 水平项离差平方和。 首先

12、看总离差平方和,不妨用SST (Sum of Squares for Total)代表,则:SST=它反映了离差平方和的总体情况。 在表4一7中己知,=28.695,由上式,我们可以计 算出: SST(265-28695)2+(287-28.695) 2+(32.8-28.695)2=1159295再看误差项离差平方和,用SSE (Sum of Squares for Error)表示,其计算公式为:对公式分析不难发现SSE反映的是水平内部,或组内观察 值的离散状况。正如前面分析的,SSE 实质上反映了 随机因素带来的影响。在表4-7的例子中,对于水平1 (即第一组),有类似地,可以对其他三个

13、组进行计算: (31.2-29.56)2(29.6-29.56)2 =8.72 (27.9-26.44)2(26.5-26.44)213.22 (30.8-31.46)2(32.8-31.46)2 =6.632从而得 到: SSE10688+857213192+6632=39.084SSE =最后一个是水平项离差平方和。为了后面叙述方便,可以 把单因素方差分析中的因素称为A。于是水平项离差平方 可以用SSA(Sum of Squares for FactorA)表示。SSA的 计算公式为SSA=用各组均值减去总均值的离差的平方,乘以各组观察值个 数nj,然后加总,即可得到SSA。可以看出,它所

14、表现的 是组间差异。其中既包括随机因素,也包括系统因素。 SST,SSE,SSA 之间存在着一定的联系。这种联系表现在 : SST=SSE+SSA 因为 在各组同为正态分布,等方差条件下,等式右边最后一项为 零,故有:即 SST=SSE+SSA 在上面例子中,己计算出 SST =115.929 5,SSE =39.084,故: SSA =SST SSE=115.9295-39.084=76.84553、计算平均平方用离差平方和除以自由度即可得到平均平方(Mean Square)。离差平方的计算前面己经介绍,关键是如 何确定各离差平方和的自由度。 对SST来说,其自由度为n-1,因为它只有一个约

15、束条件 , 对SSA来说,其自由度为r-1,这里r表示水平的个数。 如前面例子中,有四个水平,即饮料的四种不同颜色 ,故r=4。SSA反映的是组间的差异,它也有一个约束 条件,即要求: 对SSE来说,其自由度为n-r,因为对每一种水平而言, 其观察值个数为nj,该种水平下的自由度为nj,总共 有r个水平,因此拥有的自由度个数为;r(nj-1)=n -r 其实,与离差平方和一样,SST,SSA,SSE之间的自由 度也存在着如上式中的关系,因为显然:n -1= (r- 1)+(n-r)这样对于SSA,其平均平方MSA为:对于SSE,其平均平方MSE为: 在上例中:4、方差分析表在上例中: 为了将方

16、差分析的主要过程表现的更清楚,通常 把有关计算结果列成方差分析表,如表48所示。 表48 方差分析表 使用计算机进行方差分析,其输出结果的构造与表48类似。5、均值的F检验在介绍方差分析的主要步骤以后,让我们回到问题的起点 ,对若干均值是否相等进行F检验。 仍以前面饮料颜色对销售量影响为例,对所关心的问题提 出原假设和替换假设: H0: 1=2=3=4 颜色对销售量没有影响 H1 :1、2、3、4不全相等 颜色对销售量有影 响 由前已知,计算出的F值为F=10.4860若a =0.05查表知: Fa(r-1,n-r)F0.05(3,16)3.24 括号中r-1,n-r分别为分子项和分母项的自由度。 由于FFa故拒绝原假设,接受替换假设。即通过检验知, j不全相

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号