第八章方差分析与试验设计

上传人:宝路 文档编号:47135170 上传时间:2018-06-29 格式:PPT 页数:117 大小:1.20MB
返回 下载 相关 举报
第八章方差分析与试验设计_第1页
第1页 / 共117页
第八章方差分析与试验设计_第2页
第2页 / 共117页
第八章方差分析与试验设计_第3页
第3页 / 共117页
第八章方差分析与试验设计_第4页
第4页 / 共117页
第八章方差分析与试验设计_第5页
第5页 / 共117页
点击查看更多>>
资源描述

《第八章方差分析与试验设计》由会员分享,可在线阅读,更多相关《第八章方差分析与试验设计(117页珍藏版)》请在金锄头文库上搜索。

1、第八 章 方差分析与试验设计 8.1 方差分析引论 8.2 单因素方差分析 8.3 方差分析中的多重比较 8.4 双因素方差分析 8.5 试验设计初步学习目标1.解释方差分析的概念 2.解释方差分析的基本思想和原理 3.掌握单因素方差分析的方法及应用 4.理解多重比较的意义 5.掌握双因素方差分析的方法及应用 6.掌握试验设计的基本原理和方法学习重点 方差分析的基本思想和原理 单因素方差分析的方法及应用 多重比较的意义和方法 双因素方差分析的方法及应用 试验设计的基本原理和方法学习难点 方差分析的基本思想和原理 单因素方差分析的方法及应用 双因素方差分析的方法及应用8.1 方差分析引论一、方差

2、分析及其有关术语 二、方差分析的基本思想和原理 三、方差分析的基本假定 四、问题的一般提法方差分析及其有关术语方差分析由英国统计 学家R.A.Fisher首创, 为纪念Fisher,以F命 名,故方差分析又称 F 检验 (F test)。用 于推断多个总体均数有 无差异 什么是方差分析(ANOVA)? (analysis of variance) 1.是检验多个总体均值是否相等的统计方法。 2.通过分析数据的误差判断各总体均值是否相等 以判断分类型自变量对数值型因变量的影响 。如它们是否有关系,关系的密切程度如何 。 方差分析中的有关术语1 因素或因子(factor):所要检验的对象2 水平或

3、处理(treatment):因素的不同表现3 观察值:每个因子水平下得到的样本数据单因素方差分析:涉及一个分类型的自变量 双因素方差分析:涉及两个分类型的自变量 下面举例加以说明消费费者对对四个行业业的投诉诉次数 行业业 观测值观测值零售业业旅游业业航空公司家电电制造业业 1 2 3 4 5 6 757 66 49 40 34 53 4468 39 29 45 56 5131 49 21 34 4044 51 65 77 58【 例例 】为了对几个行业的服务质量进行评价,消费者协会为了对几个行业的服务质量进行评价,消费者协会 在四个行业分别抽取了不同的企业作为样本。最近一年中消在四个行业分别抽

4、取了不同的企业作为样本。最近一年中消 费者对总共费者对总共2323家企业投诉的次数统计如下表。家企业投诉的次数统计如下表。一般来说,受一般来说,受 投诉的次数越多,说明服务的质量越差,消费者协会想判断投诉的次数越多,说明服务的质量越差,消费者协会想判断 这几个行业之间的服务质量是否有差异。这几个行业之间的服务质量是否有差异。 分析四个行业之间的服务质量是否有显著差 异,实际就是判断“行业”对“被投诉次数”是 否有显著影响,可归结为检验四个行业被投 诉次数的均值是否相等。 若它们的均值相等,则“行业”对被投诉次数 是没有影响的,即各行业的服务质量没有显 著差异; 若它们的均值不全相等,则“行业”

5、对被投诉 次数是有影响的,即各行业的服务质量有显 著差异。 这里“行业”是要检验的对象,就是“因 素”或“因子”。 零售业、旅游业、航空公司、家电制造业是“行 业”这一因素的具体表现,就是“水平”或“处理” 。 在每个行业下得到的样本数据(被投诉次数)就 是观察值。 由于这里只涉及“行业”一个总体,因此称为单因 素四水平检验。 因素的每一个水平可以看做是一个总体,如零售 业、旅游业、航空公司、家电制造业可看作是四 个总体。上表中的数据可以看做是从这四个总体 中抽取的样本数据。 在单因素方差分析中,涉及两个变量:一 个分类型自变量,一个数值型的因变量。 如判断“行业”对“被投诉次数”是否有显著影

6、 响,这里“行业”就是自变量,是一个分类型 自变量,零售业、旅游业、航空公司、家 电制造业是“行业”这一变量的具体取值,是 “行业”这一因素的水平或处理 。 “被投诉次数” 是一个数值型的因变量,不 同的被投诉次数就是因变量的取值。 方差分析就是判断分类型自变量对数值型 因变量的影响。在本例中就是研究“行业”对 “被投诉次数”的影响方差分析的基本思想和原理方差分析的图形分析零售业 旅游业 航空公司 家电制造要判断“行业”对“被投诉次数”是否有显著影响,可通过散 点图来观察。下图中的折线是由被投诉次数的均值连接而 成的。 从散点图可以看出,不同行业对被投诉 次数是有显著差异的,即使同一行业不同

7、企业被投诉次数也明显不同。这表明同行 业与被投诉次数之间有一定关系。若无关 系,那么它们被投诉的次数应该差不多相 同。 但散点图反映的不同行业对被投诉次数 有显著差异可能由于抽样的随机性所造成 的。因此,需要用更有效的方法来检验这 种差异是否显著,也就是进行方差分析。 之所以称为方差分析,是因为在判断均 值之间是否有差异时需借助于方差。即 它是通过对数据误差来源的分析来判断 不同总体的均值是否相等,达到分析自 变量对因变量是否有影响的目的。方差分析中的两类误差随机误差 因素的同一水平(总体)下,样本各观察值之间的 差异 比如,同一行业下不同企业被投诉次数是不同 的 这种差异可以看成是随机因素的

8、影响,称为随 机误差 系统误差 因素的不同水平(不同总体)下,各观察值之间的 差异 比如,不同行业之间的被投诉次数之间的差异 这种差异可能是由于抽样的随机性所造成的, 也可能是由于行业本身所造成的,后者所形成的误差 是由系统性因素造成的,称为系统误差下面结合本例数据说明两类误差 首先,在同一行业(同一总体)下,样本的 各观察值是不同的(如零售业所抽取的7家企 业之间被投诉的次数是不同的)。这是由于 抽样的随机性造成的,这种误差就是随机误 差。 其次,在不同行业(不同总体)下,各观察 值也是不同的。这既可能由于抽样的随机性 造成的,也可能由于行业本身所造成的。由 行业本身所造成的误差是由于系统性

9、因素引 起的,这种误差就是系统误差。方差分析中的两类方差 数据的误差用平方和(sum of squares)表示,称为 方差。方差分为组内方差和组间方差。 组内方差(within groups) 因素的同一水平(同一个总体)下样本数据的方差 比如,零售业中所抽取的7家企业被投诉次数之 间的误差。 组内方差只包含随机误差 组间方差(between groups) 因素的不同水平(不同总体)下各样本之间的方差 比如,零售业、旅游业、航空公司、家电制造业 之间被投诉次数之间的误差。 组间方差既包括随机误差,也包括系统误差离差平方和的分解组间方差总方差组内方差1.方差分析就是通过比较两类误差,以检验均

10、值是 否相等。2.比较的基础是方差比3.如果系统误差明显地不同于随机误差,则均值就 是不相等的;反之,均值就是相等的4.误差是由各部分的误差占总误差的比例来测度的 。当这个比值大到某种程度时,就可以说因素的 不同水平之间存在着显著差异,也就是自变量对 因变量有影响。方差分析的基本思想和原理 如本例,如果不同行业对被投诉次数没 有影响,那么在组间误差中只包含随机 误差,而没有系统误差。这时,组间误 差与组内误差经过平均后的数量就应该 很接近,它们的比值就会接近1。反之 ,如果不同行业对被投诉次数有影响, 在组间误差中除了包含随机误差外,还 会包含系统误差。这时,组间误差平均 后的数值就会大于组内

11、误差平均后的数 值,它们的比值就会大于1。方差分析的基本假定方差分析的基本假定1.每个总体都应服从正态分布。即对于因素的每一个水平,其观察值是来自正态分布总体的简单随机样本。如本例中每个行业被投诉的次数必须服从正态分布。2.各个总体的方差必须相同。即对于各组观察数据,是从具有相同方差的正态总体中抽取的。如本例中每个行业被投诉次数的方差都相等。3.观察值是独立的。如本例中每个被抽中的企业被投诉的次数都与其它企业被投诉的次数独立。 在上述假定成立的前提下,要分析自变 量对因变量是否有影响,实际上就是要 检验自变量的各个水平(总体)的均值 是否相等。比如,判断行业对被投诉次 数是否有显著影响,实际上

12、也就是检验 具有同方差的四个正态总体的均值(被 投诉次数的均值)是否相等。 判断的方法是用样本数据对总体均值进 行检验。 样本均值越接近,总体均值相等的证据 也就越充分;反之,样本均值不同,推 断总体均值不相等的证据就越充分。问题的一般提法问题的一般提法 设因素有k个水平,每个水平的均值分别用1 , 2, , k 表示 要检验k个水平(总体)的均值是否相等,需要提出如 下假设: H0 : 1 2 k H1 : 1 , 2 , ,k 不全相等 设1为零售业被投诉次数的均值,2为旅游业被投诉 次数的均值,3为航空公司被投诉次数的均值,4为 家电制造业被投诉次数的均值,提出的假设为 H0 : 1 2

13、 3 4 “行业”对“被投诉次数”没有显著影响 H1 : 1 , 2 , 3 , 4 不全相等 “行业”对“被投诉次数” 有显著影响 如果原假设成立,即H0 : 1 = 2 = 3 = 4四个行业被投诉次数的均值都相等 意味着每个样本都来自均值为、方差为 2 的同一正态总体 X Xf(X)f(X) 1 1 2 2 3 3 4 4由样本均值的抽样分 布性质可知,来自正 态总体的一个简单随 机样本的样本均值 服从均值均值为、 方差为 的正态分布。 若备择假设成立,即H1 : i (i=1,2,3,4)不全相等至少有一个总体的均值是不同的 四个样本分别来自均值不同的四个正态总体 X Xf(X)f(X

14、) 3 3 1 1 2 2 4 48.2 单因素方差分析一、数据结构 二、分析步骤 三、关系强度的测量 四、用Excel进行方差分析单因素方差分析的数据结构 方差分析中只涉及一个分类型自变量时 ,称为单因素方差分析。 如要检验不同行业被投诉次数的均值是 否相等,这里只涉及“行业”一个因素, 也就是单因素方差分析,研究的是一个 分类型自变量对一个数值型因变量的影 响。 进行单因素方差分析,需要得到下面的 数据结构。单因素方差分析的数据结构 (one-way analysis of variance) 观观察值值 ( j )因素(A) i水平A1 水平A2 水平Ak1 2 : : n x11 x21 xk1x12 x22 xk2: : : : : : :x1n x2n xkn分析步骤提出假设方差分析中,原假设描述的是:在按照自变量的 值分成的类中,因变量的均值是相等的,而备 则假设则是不全相等。因此,为检验因素的k 个水平(总体)的均值是否相等,提出如下假 设: H0 : 1 = 2 = k 自变量对因变量没有显著影响 H1 : 1 ,2 , ,k不全相等 自变量对因变量有显著影响 注意:不拒绝原假设,则不能认为自变量对因 变量有显著影响;拒绝原假设,自变量对因变 量有显著影响。但只表明至少有两个总体的均 值不相等,并不意味着所有的均值都不相等。 构造检验的统计量 (计算水平的均值

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号