统计学 第二版课件 曾五一_ 第8章方差分析

上传人:E**** 文档编号:89497835 上传时间:2019-05-25 格式:PPTX 页数:43 大小:1.41MB
返回 下载 相关 举报
统计学 第二版课件 曾五一_ 第8章方差分析_第1页
第1页 / 共43页
统计学 第二版课件 曾五一_ 第8章方差分析_第2页
第2页 / 共43页
统计学 第二版课件 曾五一_ 第8章方差分析_第3页
第3页 / 共43页
统计学 第二版课件 曾五一_ 第8章方差分析_第4页
第4页 / 共43页
统计学 第二版课件 曾五一_ 第8章方差分析_第5页
第5页 / 共43页
点击查看更多>>
资源描述

《统计学 第二版课件 曾五一_ 第8章方差分析》由会员分享,可在线阅读,更多相关《统计学 第二版课件 曾五一_ 第8章方差分析(43页珍藏版)》请在金锄头文库上搜索。

1、第八章方差分析,方差分析方法引导,单因素方差分析,双因素方差分析,第一节 方差分析方法引导,方差分析问题的提出,方差分析的基本原理,一、方差分析问题的提出,在科学试验和生产实践中,有很多因素会影响到最终产品的质量,比如原料的质量、配比、工艺流程等。而且这些因素的影响程度各不相同。如何评测这些因素对产品质量的影响程度,就成为一个亟需解决的问题。首先看一个医学研究的实例。 【例8-1】为研究某种新安眠药的效果,将18只试验小白鼠随机的等分成三组,各组分别注射不同剂量的这种安眠药,观察每只小白鼠从注射到入睡的时间,得到数据如下表。,可以看出不同剂量的安眠药效果有差异,表明安眠药的剂量对入睡时间有一定

2、的影响;同时同一剂量下的六只小白鼠的入睡时间各不相同,这表明入睡时间除了受到安眠药剂量的影响之外,还有某些偶然性因素及测量误差的影响。 使用统计图表可以简明的分析数据基本状况,从箱线图(图8-1)可以看出,除了第二组分布基本对称分布以外,其余两组都是左偏分布。,图8-1 小白鼠安眠药试验入睡时间的箱线图,如果我们想检验这三个水平的平均入睡时间之间的差别,在正态总体假设前提下,即检验 、 、 ,可以采用t检验。但这会导致犯第一类错误的概率增大而失去检验的意义。比如在显著性水平 ,假设这些检验相互独立时,全部假设检验都正确接受原假设的概率是 ,可见犯一类错误的概率大幅增长。要正确合理的解决以上问题

3、,就需要使用方差分析。 方差分析,简称ANOVA(analysis of variance),就是利用试验观测值总偏差的可分解性,将不同条件所引起的偏差与试验误差分解开来,按照一定的规则进行比较,以确定条件偏差的影响程度以及相对大小。当已经确认某几种因素对试验结果有显著影响时,可使用方差分析检验确定哪种因素对试验结果的影响最为显著及估计影响程度。,在介绍方差分析之前,先要明确以下一些术语和概念。 1试验结果:在一项试验中用来衡量试验效果的特征量,也称试验指标或指标,类似函数的因变量或者目标函数。 2试验因素:试验中,凡是对试验指标可能产生影响的原因都称为因素,或称为因子,类似函数的自变量。试验

4、中需要考察的因素称为试验因素,简称为因素。一般用大写字母表示。 3因素水平:因素在试验中所处的各种状态或者所取的不同值,称为该因素的水平,简称水平。一般用下标区分。同样因素水平有时可以取得具体的数量值,有时只能取到定性值(如好,中,差等)。,二、方差分析的基本原理,(一)方差分解原理 从图8-1可以看出,如果剂量因素对三个分组的入睡时间没有影响,则三个分组的入睡时间差异仅由随机因素引起的;而如果剂量因素对入睡时间有显著影响,则还应考虑剂量因素。 一般的,试验结果的差异性可由离差平方和表示,离差平方和又可分解为组间方差与组内方差。其中,组间方差为因素对试验结果的影响的加总;组内方差则是各组内的随

5、机影响的加总。如果组间方差明显高于组内方差,说明样本数据波动的主要来源是组间方差,因素是引起波动的主要原因,则认为因素对试验的结果存在显著的影响;否则认为波动主要来自组内方差,即因素对试验结果的影响不显著。,(二)检验统计量,由上面的分析可知,因素以及因素之间的“交互作用”对试验结果是否有显著影响,不仅要看组间方差与组内方差的比较,同时也要考虑重复试验的次数,因为如果将每一次独立观测的结果作为一个独立变量,方差则是所有变量和其均值的残差平方和。构成方差的独立变量个数越多,其方差越大;而独立变量个数越小,其方差越小。在统计中这些独立变量的个数称为自由度。为了消除自由度对方差大小的影响,我们用方差

6、除去自由度后的结果来比较两者相对大小。由此得到一个检验因素影响是否显著的统计量: F统计量的值越大,就越能说明组间方差是离差平方和的主要来源,因素影响显著;F统计量的值越小,就越能说明组内方差是离差平方和的主要来源,因素影响不显著。,第二节 单因素方差分析,单因素条件下的平方和分解公式,因素作用显著性的检验,应注意的问题,一、单因素条件下的平方和分解公式,在试验中只考虑一个因素对试验结果影响显著性的方差分析称为单因素方差分析。为了检验该因素的不同水平下的均值是否有显著差异,我们可在该因素的不同水平下进行一组重复试验(或抽样);并将处不同水平下的试验结果作为来自不同总体的样本,即得到了多个组别的

7、重复试验结果。一般,单因素方差分析的试验结果可以记为下表。,表示在 水平下,第 次实验的实验结果。 总离差平方和 表示试验结果的差异性的总和,(8.1),(8.2),(8.3),(8.4),(8.5),按方差分解的原理可得: 交叉项为零,因为,同时可以得到: 为组间方差,由不同水平下的各组均值和总平均值的残差平方和; 是组内方差,即各组实验结果和各组均值的残差平方和。由此可得离差平方和的分解公式:,(8.6),(8.7),(8.8),二、因素作用显著性的检验,若记各水平下的总体均值为 ,则检验因素对试验结果影响的显著性就是检验假设: 或简单写成 由前所述,只要建立关于 与 的F统计量就可以进行

8、假设检验。在此之前,先要推算出对应的自由度。,(8.9),(8.10),是所有 与总均值的残差平方和,但这nr个 需要满足的一个约束条件 ,因此只有nr-1个独立变量,即自由度是nr-1。 是因素在不同水平下的均值 的残差平方和,应满足约束条件 ,因此自由度是r-1。 是由所有的 相对于各水平下均值的残差平方和,要满足r个约束条件 (i=1,2,,r),所以 的自由度是r(n-1)。综上, 、 和 的自由度满足: nr-1=(r-1)+r(n-1) 方差除去自由度后,就可以得到组间均方差 与组内均方差 :,(8.11),(8.12),(8.13),进一步,可直接构造F统计量来检验前面提出的假设

9、(8.9)或(8.10), F值越大,越说明组间方差大于组内方差,因此组间方差构成了离差平方和的主要来源,即因素的不同水平对试验结果影响较大,应拒绝原假设;反之,说明组内方差是主要来源,不能拒绝原假设。对于给定的显著性水平,查F分布表得临界值 ,当F 时,拒绝原假设,认为因素对总体有显著影响;当F 时,不能拒绝原假设,即不能拒绝因素对试验结果的影响不显著。,(8.14),为了方便分析,通常我们把方差分析列成一张方差分析表。,【例8-2】请对【例8-1】进行单因素方差分析(显著水平0.05 )。 解:这是一个等重复的单因素试验。根据题意,设在三种剂量下的入睡时间均值为 。检验安眠药剂量对入睡时间

10、是否有显著影响就是建立假设检验 , 不全相等。使用Excel软件中的单因素方差分析可以很方便的得到如下的分析表。 从表中可以看出 值p1.08E-06,远远小于0.05 。所以认为安眠药剂量对入睡时间存在显著影响,应该拒绝原假设 。,【例8-3】现有四种不同产地的化工原料,按照同样的工艺合成一新产品,测得新产品的熔点(单位:摄氏度)数据如下表。 请分析原料产地对产品熔点的影响(显著水平 0.05 )。 解:这是一个不等重复的单因素试验。由题意设原料来自四个产地的产品熔点均值为 。可以建立假设检验 , 不全相等。由Excel软件的方差分析可以得到下表。 由于 值p=0.274499,大于显著水平

11、0.05 。所以认为原料产地不会对新产品的熔点产生显著影响,不能拒绝原假设 。,三、应注意的问题,1方差分析需满足的假设条件。方差分析实质上是对各总体均值相等假设进行检验,为了得到检验统计量的精确分布,要求满足的前提条件是(1)每次试验都是独立进行的;(2)各样本都是来自正态总体的;(3)各总体的方差是相等的。只有满足这些条件,方差分析的结果才是有效的。而一般地,我们总认为以上的假定条件都是满足的或近似满足的。 2在实际问题中,各水平下的总体的试验次数可以相等也可以不等,分析过程和结论基本不变。但是当试验次数相差较大或因素较多时应该考虑采用广义线性模型分析,以消除非均衡试验设计的影响。 3方差

12、分析只能判断各总体的均值是否相等,而不能判断出哪个总体的均值是大还是小,这时需要在均值不等的前提下,将采用多重比较法进一步比较各个均值的大小。,第三节 双因素方差分析,无交互作用的双因素方差分析,有交互作用的双因素方差分析,在实际问题中往往需要考察多个因素对试验结果的影响程度,这时就需要进行多因素试验的方差分析。多因素方差分析和单因素方差分析基本原理相同,但除了考虑因素对试验结果的影响之外,还需要考虑因素之间的相互影响,这种多个因素的不同水平的组合对指标的影响称为因素间的交互作用。本节主要介绍双因素方差分析,多因素方差分析的原理和双因素方差分析相同,可以类推得到。先看下面的例题 【例8-4】有

13、一工业产品,在两种不同用量的催化剂( P,N)作用下产量如下表:,这里,有两个因素P和N对产量起作用。从图形上可以清楚看到,当P=0时和当P=4时,对应的N=0和N=6的产量各不相同。这就表明因素P的影响程度要受因素N的水平影响,即存在因素之间的交互作用。而若P=0和P=4的两条直线平行,则可以认为 之间不存在交互作用或者交互作用不显著。,图8-2 P,N对产量的交互效应,对于存在交互作用的情况,必须要在两个因素的各种水平组合下进行重复试验,并利用重复试验的平均值来估计该水平组合对试验结果的影响,以区分出试验误差和交互作用。而对于交互作用不显著的情况则没有必要重复试验。 因此双因素方差分析可以

14、分为无交互作用的方差分析和有交互作用的方差分析。而无交互作用的方差分析无需重复试验;有交互作用的方差分析需要在不同水平组合下进行重复试验,其中又有等重复的双因素方差分析和不等重复的双因素方差分析之分。本节主要介绍无交互作用的方差分析和等重复的交互作用的方差分析。,一、无交互作用的双因素方差分析,A与B是待确认是否对试验结果有显著影响的两个因素,假定A,B之间无交互作用,在两个因素的各种水平组合下进行重复试验可得表8-6。 是在因素A的各个水平下s个试验结果的均值; 是在因素B的各种水平下r个试验结果的均值。,根据方差分解原理可得: 依次展开有:,(8.15),(8.16),(8.17),(8.

15、18),(8.19),表示的是因素A的各个水平下各组试验结果与该组均值的残差平方和, 是因素B的各个水平下各组试验结果与该组均值的残差平方和, 是A,B所有水平组合下的试验结果和均值的残差平方和。类似单因素方差分析可知, 的自由度为rs-1, 的自由度为r-1, 的自由度为s-1, 的自由度为(r-1)(s-1)。 对应的均方差为:,(8.20),(8.21),(8.22),检验因素A与B对试验结果的影响是否显著的F统计量分别为: 综合以上结论可以得到方差分析表:,(8.23),(8.24),【例8-5】为了给同规格的四种品牌(brand)的电视机鉴定评分,邀请了5位专家(scorer)评价,结果见下表。 假设各水平搭配下总体服从正态分布且同方差,且鉴定人无法知道电视机的品牌(即鉴定人与电视机品牌无交互作用),试用方差分析检验品牌和专家是否对评分有影响(显著水平0.05)。,解:设电视机品牌因素为,专家因素为,由题意建立假设检验: 可由Excel软件的方差分析直接得到以下方差分析表。 可以看出在品牌和专家两个因素中,专家的p值=0.0899810.05,可以认为专家对评分没有显著影响。而品牌的p值=0.000446,说

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号