第6章 方差分析

上传人:suns****4568 文档编号:86827137 上传时间:2019-03-25 格式:PDF 页数:18 大小:294.13KB
返回 下载 相关 举报
第6章 方差分析_第1页
第1页 / 共18页
第6章 方差分析_第2页
第2页 / 共18页
第6章 方差分析_第3页
第3页 / 共18页
第6章 方差分析_第4页
第4页 / 共18页
第6章 方差分析_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《第6章 方差分析》由会员分享,可在线阅读,更多相关《第6章 方差分析(18页珍藏版)》请在金锄头文库上搜索。

1、第第 6 章 方差分析章 方差分析 6.1 方差分析概述方差分析概述 第 5 章中,我们讨论了如何检验两总体均值是否相等的问题。但是,在实际工作中, 常常需要对多个总体的均值进行比较, 并分析它们之间的差异。 在现实的生产和经营管理过 程中,影响产品质量、数量或销量的因素往往很多。例如,农作物的产量受作物的品种、施 肥的多少及种类等的影响;某种商品的销量受商品价格、质量、广告等的影响。这时,如果 沿用两总体均值比较的方法,则会碰到两个问题:一是计算工作冗繁。例如,如果我们要比 较 4 个总体的均值,则需要进行 2 4 6C =次两两比较。二是不能同时利用全部的观察数据, 推断的精度将会降低。于

2、是,引入方差分析(ANOVA)的方法。方差分析也是一种假设检 验, 它是对全部样本观测值的变动进行分解, 将某种控制因素下各组样本观测值之间可能存 在的由该因素导致的系统性误差与随机误差加以比较, 据以推断各组样本之间是否存在显著 差异。若存在显著差异,则说明该因素对各总体的影响是显著的。 方差分析有三个基本的概念:观测变量、因素和水平。观测变量是我们进行方差分析所 研究的对象; 因素是影响观测变量变化的客观或人为条件; 因素的不同类别或不同取值则称 为因素的不同水平。在上面的例子中,农作物的产量和商品的销量就是观测变量;作物的品 种、施肥种类、商品价格、广告等就是因素。在方差分析中,因素常常

3、是某一个或多个离散 型的分类变量。 根据观测变量的个数, 可以将方差分析分为单变量方差分析和多变量方差分析; 根据因 素的个数,可以将方差分析分为单因素方差分析和多因素方差分析。在 SPSS 中,有针对每 一种类型方差分析方法的命令。它们分别是:One-way ANOVA(单变量单因素方差分析)、 GLM Univariate(单变量多因素方差分析)和 GLM Multivariate(多变量多因素方差分析) 。不 同的方差分析方法适用于不同的实际情况。 本书仅介绍最为常用的单变量单因素方差分析和 单变量多因素方差分析。 6.2 单因素单变量方差分析单因素单变量方差分析 6.2.1 理论和方法

4、理论和方法 如上所述, 单因素方差分析其实就是关于在一个影响因素的不同水平下, 观测变量均值 差异的显著性检验。 方差分析认为, 观测变量的变动会受到因素变量和随机变量两方面的影 响。因此,将观测变量的总离差平方和()分解为组间离差平方和()与组内离 差平方和() ,即: SSTSSB SSE SSTSSBSSE=+ 其中,是由于因素变量的不同水平引起的观测变量变动;是由随机因素引起 的观测变量的变动, 如果由于因素变量引起的观测变量的变动占观测变量总变动的比例足够 大, 则可以认为因素变量对观测变量的影响是显著的, 也即观测变量在不同因素水平下均值 存在显著差异。 SSBSSE 假设某个影响

5、因素共有r个不同的水平, ij x是因素的第i个水平下的第j个样本值, 为因素的第 个水平下的样本个数, i n i i x为因素的第 个水平下观测变量的样本均值,ix为观 测变量的均值,则有下面的数学定义: 2 1 () r ii i SSBn xx = = 2 11 () i n r iji ij SSExx = = 2 11 () i n r ij ij SSTxx = = 可以证明,、和分别服从自由度为SSBSSESST1r、nr和的1n 2 分布。这 样,就可以构造一个服从自由度为(1r ,nr)的F分布的统计量: (1) () MSBSSB r F MSESSE nr = 综上,可

6、以得到表 6-1所示的单因素方差分析表。 表 6-1 单因素方差分析表 方差来源 离差平方和 自由度 均方差 F值 组间 (因素影响) 2 1 () r ii i SSBn xx = = 1r 1 SSB MSB r = MSB F MSE = 组内 (随机影响) 2 11 () i n r iji ij SSExx = = nr SSE MSE nr = 总和 2 11 () i n r ij ij SSTxx = = 1n 1 SST MST n = 既然方差分析也是一种假设检验,那么它的基本步骤与前面介绍的 t 检验基本一致: 1. 建立原假设: 012r H=L:, 不完全相等。其中,

7、 1 (1,2, ) i Hi=L:r i 为 因素的第 个水平下观测变量的总体均值。即单因素方差分析的原假设为不同因素水平下观 测变量各总体均值无显著差异。 i 2. 构造统计量: (1) () MSBSSB r F MSESSE nr = 原假设满足的条件下,该统计量服从自由度为(1r ,nr)的分布。 F 3. 利用原假设和样本数据计算统计量和其对应的Fp值。 4. 对比p值和,结合原假设作出推断。如果p值,则不能拒绝原假设,应 认为不同因素水平下观测变量各总体均值无显著差异, 即这个因素对观测变量没有显著的影 响。 6.2.2 SPSS 操作步骤操作步骤 假设某汽车经销商为了研究东部、

8、西部和中部地区市场上汽车的销量是否存在显著差 异,在每个地区随机抽取几个城市进行调查统计,调查数据放置与数据文件“汽车销量调 查.sav”中。在 SPSS 中实现该检验的步骤如下: 1. 选择菜单项AnalyzeCompare meansOne-Way ANOVA, 打开One-Way ANOVA对话 框,如图 6-1。将观测变量sales移入Dependent List列表框,将因素变量region移入Factor列表 框。 这里需要注意一点,Dependent List 列表框中可以移入多个观测变量,但是这并不表示 One-Way ANOVA 命令可以实现多变量方差分析。多变量方差分析中各

9、个观测变量应该是一 组相关的变量,例如学生的物理、英语和数学考试成绩。如果在 Dependent List 列表框中移 入多个观测变量,则 SPSS 不会考虑各个变量之间的相关性,只是对每个观测变量独立地进 行单变量方差分析, 然后将各个单变量方差分析结果独立地排列在结果输出窗口中。 如果想 要考虑某个因素对一组相关变量集的影响关系,应该使用 GLM Multivariate(多变量多因素 方差分析)命令。 图 6-1 One-Way ANOVA 对话框 2. 单击Contrasts按钮可以打开Contrasts子对话框,如图 6-2。这个对话框用于实现趋势 检验和先验对比检验。 Polyno

10、minal 选项用于进行趋势检验,即检验观测变量与因素变量是否满足一定的趋势 关系。 选择该复选框后, 单击右边的下拉列表可以选择观测变量与因素变量之间可能满足的 趋势关系,包括线性趋势、二次多项式趋势、三次多项式趋势等。 先验对比检验是用于检验各个因素水平下观测变量的均值之间是否满足一定的线性关 系。例如,可以检验是否满足东部汽车的平均销量是否西部和中部两地区平均销量的总和。 即要检验三个总体是否满足:,则将需要将系数1、1、-1依次加入中间的列 表框中。加入的方法是在Coefficients输入框中输入适当的系数,然后单击Add按钮,依次 类推。如果想要修改已经输入列表框的系数,选择该系数

11、,在Coefficients输入框中输入新 的系数,单击Change按钮确认修改。如果想删除已经输入列表框的系数,选择该系数,单 123 0+= 击Remove按钮。 另外,在一组系数设置完成之后,通过单击Next按钮还可以继续设置另外一组线性系 数。这里我们设置另一组系数0.5、-1、0.5来检验东西部地区汽车销量的平均值是否等于中 部地区汽车销量。 图 6-2 Contrasts 子对话框 3. 单击Post Hoc按钮,打开Post Hoc Multiple Comparisons对话框,如图 6-3。该对话框 用于进行多重比较检验,即各因素水平下观测变量均值的两两比较。 我们知道, 方

12、差分析的原假设是各个因素水平下的观测变量均值都相等, 备择假设是各 均值不完全相等。 假如一次方差分析的结果是拒绝原假设, 我们只能判断各观测变量均值不 完全相等, 却不能得出各均值完全不相等的结论。 各因素水平下观测变量均值的更为细致的 比较就需要用到多重比较检验。 Equal Variances Assumed选项栏中给出了在观测变量满足不同因素水平下的方差齐性条 件下的多种检验方法。这里我们选择最常用的LSD检验法。 Equal Variances Not Assumed选项栏中给出了在观测变量不满足方差齐性条件下的多种 检验方法。这里我们选择Tamhanes T2检验法。 Signif

13、icance level输入框中用于输入多重比较检验的显著性水平,默认为5%。 图 6-3 Post Hoc Multiple Comparisons 对话框 4. 单击Options按钮,打开Options子对话框,如图 6-4。在对话框中选择Descriptive复选 框,输出不同因素水平下观测变量的描述统计量;选择Homogeneity of variance test复选框, 输出方差齐性检验结果;选择Means plot复选框,输出不同因素水平下观测变量的均值直线 图。 图 6-4 Options 子对话框 5. 在主对话框中单击OK按钮,就可以得到单因素方差分析的结果。 6.2.3

14、 实例结果分析实例结果分析 表 6 表 -2给出了不同地区汽车销量的基本描述统计量以及95%的置信区间。从表中可以看出, 东部地区汽车平均销量最高,中部销量尚可,西部销量最低。这一点可以从图 6-5各个因素 水平下汽车平均销量折线图直观地看出。 6-3给出了Levene方差齐性检验结果。从表中可以看到,Levene统计量对应的p值大于 0.05,所以,得到不同地区汽车销量满足方差齐性的结论。 表 量 6-4是单因素方差分析结果表,与表 6-1的结构相同,第二列给出了组间离差平方和、组 内离差平方和及总离差平方和;第三列给出了它们对应的自由度,第四列是对应的均方差; 第五列和第六列分别给出了F统

15、计和它对应的p值。由于p0.0130.05,所以接受原假设,即东西部地区汽车的平均销量与中部地区汽车平 均销量没有显著差异。 表 6-2 各个因素水平下汽车销量的描述统计量 Descriptives 销量 10157.9022.2787.045141.96173.84120194 9176.4419.7176.572161.29191.60135198 7196.1430.92711.689167.54224.75145224 26174.6227.8455.461163.37185.86120224 西 中 东 Total NMeanStd. DeviationStd. ErrorLower

16、 BoundUpper Bound 95% Confidence Interval for Mean MinimumMaximum 表 6-3 各个因素水平下汽车销量方差齐性检验表 Test of Homogeneity of Variances 销量 1.262223.302 Levene Statisticdf1df2Sig. 表 6-4 单因素方差分析结果 ANOVA 销量 6068.17423034.0875.241.013 13315.9823578.956 19384.1525 Between Groups Within Groups Total Sum of SquaresdfMean SquareFSig. 表 6-5 先验对比系数表 Contrast Coefficients 11-1 .5-1.5 Contrast 1 2 西中东 地区 表 6-6 先验对比检验结果 Contrast Tests 138.20a

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 资格认证/考试 > 其它考试类文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号