第六章 SPSS方差分析

上传人:012****78 文档编号:132721127 上传时间:2020-05-19 格式:PPT 页数:50 大小:494.50KB
返回 下载 相关 举报
第六章 SPSS方差分析_第1页
第1页 / 共50页
第六章 SPSS方差分析_第2页
第2页 / 共50页
第六章 SPSS方差分析_第3页
第3页 / 共50页
第六章 SPSS方差分析_第4页
第4页 / 共50页
第六章 SPSS方差分析_第5页
第5页 / 共50页
点击查看更多>>
资源描述

《第六章 SPSS方差分析》由会员分享,可在线阅读,更多相关《第六章 SPSS方差分析(50页珍藏版)》请在金锄头文库上搜索。

1、第六章 SPSS 本章内容 6 1方差分析概述6 2单因素方差分析6 3多因素方差分析6 4协方差分析 6 1方差分析概述 6 1 1方差分析的作用在诸多领域的数量分析研究中 找到众多影响因素中重要的影响因素是非常重要的 比如 在农业生产中 有许多因素会影响农作物的产量 如种子的品种 施肥量 气候 地域等 他们都会给农作物的产量带来或多或少的影响 如果我们能够掌握在众多的影响因素中 哪些因素对农作物的产量 观测变量 起到了主要的 关键性的作用 我们就可以根据实际情况对这些关键因素加以控制 控制变量 进一步 在掌握关键影响因素之后 还应进一步确定控制变量的不同水平对观测变量的影响程度如何 其中哪

2、个水平的作用明显大于其它水平 哪些水平的作用是不显著的 6 1 2相关概念1 影响因素的分类 在所有的影响因素中根据是否可以人为控制可以分为两类 一类是人为可以控制的因素 称为控制因素或控制变量 如种子品种的选定 施肥量的多少 另一类因素是认为很难控制的因素 称为随机因素或随机变量 如气候和地域等影响因素 在很多情况下随机因素指的是实验过程中的抽样误差 2 控制变量的不同水平 控制变量的不同取值或水平 称为控制变量的不同水平 如甲品种 乙品种 10公斤化肥 20公斤化肥 30公斤化肥等 3 观测变量 受控制变量和随机变量影响的变量称为观测变量 如农作物的产量等 方差分析就是从观测变量的方差入手

3、 研究诸多控制变量中哪些变量是对观测变量有显著影响的变量以及对观测变量有显著影响的各个控制变量其不同水平以及各水平的交互搭配是如何影响观测变量的一种分析方法 6 1 3方差分析的原理方差分析认为 如果控制变量的不同水平对观测变量产生了显著影响 那么它和随机变量共同作用必然使得观测变量值显著变动 反之 如果控制变量的不同水平没有对观测变量产生显著影响 那么观测变量值的变动就不明显 其变动可以归结为随机变量影响造成的 两个基本假设 1 观测变量各总体应服从正态分布 2 观测变量各总体的方差应相同 方差分析的问题就转化为在控制变量不同水平上的观测变量均值是否存在显著差异的推断了 根据控制变量的个数可

4、将方差分析分为单因素方差分析 多因素方差分析 根据观测变量的个数可将方差分析分为一元方差分析 单因变量方差分析 和多元方差分析 多因变量方差分析 6 2单因素方差分析 6 2 1单因素方差分析的基本思想1 定义 单因素方差分析用来研究一个控制变量的不同水平是否对观测变量产生了显著影响 例如 分析不同施肥量是否给农作物的产量产生显著影响 研究不同学历是否对工资收入产生显著影响等 2 观测变量方差的分解将观测变量总的离差平方和分解为组间离差平方和和组内离差平方和两部分 分别表示为 其中 SST为观测变量的总离差平方和 SSA为组间离差平方和 是由控制变量不同水平造成的观测变量的变差 SSE为组内平

5、方和 是由抽样误差引起的观测变量的变差 其中 各离差平方和的计算 例题 3 比较观测变量总离差平方和各部分的比例在观测变量总离差平方和中 如果组间离差平方和所占比例较大 则说明观测变量的变动主要是由于控制变量引起的 可以主要由控制变量来解释 即控制变量给观测变量带来了显著影响 这里我们用F统计量来表示这种比例关系 如果控制变量的不同水平对观测变量造成了显著影响 那么观测变量总变差中控制变量所占的比例较大 则F值就比较大 反之 如果控制变量的不同水平对观测变量没有造成显著影响 那么观测变量总变差中控制变量所占的比例较小 则F值就比较小 6 2 2单因素方差分析的基本步骤提出原假设 控制变量不同水

6、平下观测变量各总体的均值无显著差异计算检验统计量和概率P值给定显著性水平与p值做比较 如果p值小于显著性水平 则应该拒绝原假设 反之就不能拒绝原假设 说明 在利用SPSS进行单因素方差分析时 应注意数据的组织形式 SPSS要求定义两个变量分别存放观测变量值和控制变量的水平值 6 2 3单因素方差分析的应用举例某企业在制订某商品的广告策略时 对不同广告形式在不同地区的广告效果 销售额 进行了评估 这里以商品销售额为观测变量 广告形式和地区为控制变量 通过单因素方差分析方法分别对广告形式 地区对销售额的影响进行方差分析 6 2 4单因素方差分析的进一步分析1 方差齐性检验由于方差分析的前提是各水平

7、下的总体服从正态分布并且方差相等 因此有必要对方差齐性进行检验 即对控制变量不同水平下各观测变量不同总体方差是否相等进行分析 SPSS单因素方差分析中 方差齐性检验采用了方差同质性 HomogeneityofVariance 的检验方法 其零假设是各水平下观测变量总体方差无显著性差异 实现思路同SPSS两独立样本t检验中的方差齐性检验 2 多重比较检验上面的基本分析可以判断控制变量是否对观测变量产生了显著影响 如果控制变量确实对观测变量产生了显著影响 进一步还应确定 控制变量的不同水平对观测变量的影响程度如何 其中哪个水平的作用明显大于其它水平 哪些水平的作用是不显著的 例如已经确定不同施肥量

8、会对农作物的产量产生显著影响 便希望进一步了解究竟是10公斤 20公斤还是30公斤施肥量最有利于提高产量 哪种施肥量对农作物产量没有显著影响 掌握了这些信息 我们就能够制定合理的施肥方案 多重比较检验就是分别对每个水平下的观测变量均值进行逐对比较 判断两均值之间是否存在显著差异 其零假设是相应组的均值之间无显著差异 SPSS提供的多重比较检验的方法比较多 有些方法适用在各总体方差相等的条件下 有些适用在方差不相等的条件下 其中LSD方法适用于各总体方差相等的情况 特点是比较灵敏 Tukey方法和S N K方法适用于各水平下观测变量个数相等的情况 Scheffe方法比Tukey方法不灵敏 3 其

9、他检验 1 先验对比检验如果发现某些水平与另一些水平的均值差距显著 就可以进一步比较这两组总的均值是否存在显著差异 在检验中 SPSS根据用户确定的各均值的系数 再对其线性组合进行检验 来判断各相似性子集间均值的差异程度 如有5个水平 其中水平均值a b c与d e有显著差异 就可进一步比较这两组总的均值是否存在显著差异 即1 3 a b c 与1 2 d e 是否有显著差异 也即推断1 3 a b c 1 2 d e 是否显著为0 系数分别为1 3 1 3 1 3 1 2 1 2 17 2 趋势检验当控制变量为定序变量时 趋势检验能够分析随着控制变量水平的变化 观测变量值变化的总体趋势是怎样

10、的 6 2 5单因素方差分析进一步分析应用举例前面例子中已经利用单因素方差分析分别对广告形式 地区对销售额的影响进行了分析 分析的结论是不同的广告形式 不同的地区对销售额有显著影响 下面可作进一步的分析 1 方差齐性检验不同广告形式 不同地区下销售额总体方差是否相同 是否满足单因素方差分析的前提要求 是应首先检验的问题 2 多重比较检验总体上讲 不同广告形式对产品的销售额有显著影响 那么究竟哪种广告形式的作用较明显哪种不明显 这些问题可通过多重比较检验实现 同理 可对商品在不同地区的销售额情况进行分析 采用LSD Bonferroni Tukey Scheffe S N K五种方法 3 先验对

11、比检验通过对不同广告形式的多重比较分析可知 在四种广告形式中 宣传品广告的效果是最差的 而其余三种略有差异 这里 可采用先验对比检验方法 进一步对报纸广告的效果与广播和体验的整体效果进行对比分析 4 趋势检验通过上面的分析 可以清楚地掌握不同地区的销售情况 这里 如果假定不同地区的差异表现在人口密度方面 地区编号小的人口密度高 地区编号大的人口密度低 那么进一步可分析不同地区销售额总体上是否会随着地区人口密度的减少而呈现出某种趋势性的变化规律 进而为市场细分提供依据 20 问题 分析不同广告形式和不同地区是否给销售量产生显著影响 并进一步研究哪种广告形式和哪个地区的搭配方式可获得最理想的销售业

12、绩 6 3多因素方差分析 6 3 1多因素方差分析的基本思想1 定义 多因素方差分析用来研究两个及两个以上控制变量的不同水平是否对观测变量产生了显著影响 多因素方差分析不仅能够分析多个因素对观测变量的独立影响 还能够分析多个控制变量的交互作用能否对观测变量产生显著影响 例如 分析不同品种 不同施肥量是否给农作物的产量产生显著影响 并进一步研究哪种品种和哪种施肥量是提高农作物产量的最优组合 2 观测变量方差的分解将观测变量总的离差平方和分解为 其中 SST为观测变量的总离差平方和 SSA SSB分别为控制变量A B独立作用引起的变差 SSAB为控制变量A B两两交互作用引起的变差 SSE为随机因

13、素引起的变差 其中 交互作用的理解 3 比较观测变量总离差平方和各部分的比例在观测变量总离差平方和中 如果SSA所占比例较大 则说明控制变量A是引起观测变量的变动主要因素之一 观测变量的变动可以部分的由控制变量A来解释 即控制变量A给观测变量带来了显著影响 对SSB SSAB同理 25 多因素方差分析的数学模型 研究销售数据的主要目的是看销售额 因变量 是否受到促销方式 售后服务这两个自变量的影响 这两个是定性变量 亦称为因子 分别有3个和2个水平 以及怎样的影响 26 1 考虑主效应与交互效应 饱和模型 用y表示销售额 ai表示促销方式 下标表示不同水平 bj表示售后服务 ab ij表示促销

14、方式与售后服务的交互效应 则相应的线性模型为 或有常数项时加上常数项u 这里的下标i代表促销的水平 下标j代表是否有售后服务 下标k代表每种ij组合中的第k个观测 最后一项eijk为随机误差 2 27 2 只考虑主效应 不考虑交互效应 非饱和模型 用y表示销售额 ai表示促销方式 下标表示不同水平 bj表示售后服务 则相应的只有主效应的线性模型为 这里的下标i代表促销的水平 下标j代表是否有售后服务 下标k代表每种ij组合中的第k个观测 最后一项eijk为随机误差 6 3 2多因素方差分析的基本步骤提出原假设 各控制变量不同水平下观测变量各总体的均值无显著差异 控制变量交互作用对观测变量无显著

15、影响 计算检验统计量和概率P值多因素方差分析模型包括 固定效应模型 随机效应模型 1 固定效应模型中F检验统计量为 29 2 随机效应模型中F检验统计量为 30 给定显著性水平与p值做比较 如果p值小于显著性水平 则应该拒绝原假设 反之就不能拒绝原假设 6 3 3多因素方差分析的基本操作步骤在利用SPSS进行多因素方差分析时 应首先将各个控制变量以及观测变量分别定义成多个SPSS变量 并组织好数据再进行分析 1 选择菜单Analyze GeneralLinearModel Univariate 出现主窗口 2 把观测变量指定到DependentVariable框中 3 把固定效应的控制变量指定

16、到FixedFactor s 框中 把随机效应的控制变量指定到RandomFactor s 框中 至此 SPSS将自动建立多因素方差分析的饱和模型 并计算各检验统计量的观测值和对应的概率p值 并将结果显示到输出窗口中 6 3 4多因素方差分析应用举例利用某企业不同广告形式在不同地区的广告效果 销售额 进行评估的数据 通过多因素方差分析方法对广告形式 地区 广告形式和地区的交互作用给销售额的影响进行分析 进而为制订广告和地区的最优宣传组合方案提供依据 这里 以广告形式和地区为控制变量 销售额为观测变量 建立固定效应的饱和模型 零假设为 不同广告形式没有对销售额产生显著影响 不同地区的销售额没有显著差异 广告形式和地区对销售额没有产生显著的交互影响 6 3 5多因素方差分析的进一步分析1 多因素方差分析的非饱和模型在饱和模型中 观测变量总的变差被分解为控制变量独立作用 控制变量交互作用及随机误差三部分 例 SST SSA SSB SSAB SSE 如果研究发现 控制变量的某阶交互作用没有给观测变量产生显著影响 那么可以尝试建立非饱和模型 区别在于将饱和模型中某些部分合并到SSE中 例如两因

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号