《数据分析教程》方差分析

上传人:宝路 文档编号:49627723 上传时间:2018-07-31 格式:PPT 页数:34 大小:1MB
返回 下载 相关 举报
《数据分析教程》方差分析_第1页
第1页 / 共34页
《数据分析教程》方差分析_第2页
第2页 / 共34页
《数据分析教程》方差分析_第3页
第3页 / 共34页
《数据分析教程》方差分析_第4页
第4页 / 共34页
《数据分析教程》方差分析_第5页
第5页 / 共34页
点击查看更多>>
资源描述

《《数据分析教程》方差分析》由会员分享,可在线阅读,更多相关《《数据分析教程》方差分析(34页珍藏版)》请在金锄头文库上搜索。

1、SPSS数据分析教程方差分析方差分析的主要内容 n掌握方差分析的基本思想n了解方差分析和比较均值的异同n掌握单因素方差分析的应用条件、方法和结 果的解释n掌握多因素方差分析的应用条件、方法和结果 的解释n掌握协方差分析的应用条件、方法和结果的 解释nt检验应 用于研究单样 本均值的比较和两个样本均值 的比较。在生产活动和科学研究中经常会遇到比较 三个或者三个以上样本均值的差异问题 。这时 ,采 用的统计 方法称为方差分析,简称ANOVA( ANalasis Of VAriance)。 n例如某机构对当前民众的生活状况进行调查 ,根据 被调查 者的回答把居民对待生活的态度分为三类: 认为 生活丰

2、富多彩、生活平平常常和生活乏味三类, 它们想知道人们对 待生活的态度是否和他们受教育 的情况有关系,即这三类人是否在受教育程度上有显 著的区别。 方差分析的术语n试验 中的实验结 果是需要分析的变量,称为响应变 量,或者因变量。方差分析的因变量必须为 尺度类 型的数据(即连续 数据)。n影响试验结 果的因素即为影响响应变 量的变量,称 为自变量或者因子。根据试验 中这些因素的处理方 式,因素可以分为控制因素、随机因素和协变 量。n因子的不同取值称为因子的不同水平。n控制因素一般要求为分类变 量,而协变 量要求为尺 度数据。 n控制因素:它是试验 中可以控制的影响试验结 果的 因素,因素的不同水

3、平会导致不同的试验结 果。n不可控因素:因素的水平与试验结 果的关系是随机的 ,即不确定因素,但是不同于随机因素,可以理解为 非研究关心的因素或非处理因素。n随机因素:因素与试验结 果的关系是随机的,其水平 也是随机出现的。n处理:在试验 中,控制因素的一个水平或者几个控制 因素的某一水平组合称为一个处理。方差分析的前提条件n方差分析的自变量是“因子”或者“因素”,它是 分类变 量;其因变量则为 尺度变量,需要满 足以下两个基本前提条件:n每个处理的因变量为正态分布(正态性)n每个处理的因变量具有相同的方差(方差齐 性)单因素的方差分析n用于研究一个影响因素对试验结 果的影响, 它用于比较两个

4、或者两个以上的总体之间是 否有显著的差异 nSPSS的单因素方差分析提供下列分析结果:q试验结 果在不同组别 的统计q检验 各个组别 方差是否相等q各个组别 的概略图(均值图 )q配对多重比较q不同组别组 合的对比检验q同类子集单因素方差分析举例n销售经理想了解新员工培训的最佳方式。目 前有三种新员工培训方式:为期一天的培训 、为期二天的培训和为期三天培训。现在需 要比较用这三种方式培训员 工的效果,分析 这三种培训方式培训员 工的效果是否有显著 的差异,如果有差异,哪种培训方式最佳。n打开数据文件salesperformance.sav,它包含 两个变量,“组”变量记录 了培训方式;“得分”

5、 是对员 工培训效果的评价。SPSS实现n选择 【分析】【比较均值】【单因素ANOVA】 选择两两比较方法选择进行方差齐性检验和统计量、图 形点击【选项】,在统计量部分勾选“描述性”和 “方差同质性检验”两项,同时勾选“均值图 (M)”。 结果解释两两比较结果及解释由于Levene检验没有证据说明三种培训方式的方差相等,参照两种 不同的两两比较的结果是必要的。Bonferroni和Tamhane多重比较的结果是一致的。即培训2天和培训3 天没有显著的区别,而培训1天与另外两种培训都有显著区别。 同质子集Tukey B两两比较输出的结果,它把在5%的显著性 水平下没有区别的总体放在同一列,作为同

6、类子集 。这里,培训2天和培训3天没有显著区别,它们 作为一类。而培训1天单独作为1类。 轮廓图轮廓图为各个总体的均值的折线图,从中可以直 观的看出各个总体均值的趋势。多因素方差分析n如果影响试验结 果的因素有两个或者两个以 上,是否不同的处理对试验结 果有显著性影 响,不同的因素是否有交互作用?可以应用 SPSS的一般线性模型(GLM)来完成多因素 的方差分析。 SPSS GLM过程假设条件n误差之间相互独立,并且也独立于模型中的其 他变量。一般好的试验设计 都可以避免违反 该条件。n不同处理的误差为常数。 n误差服从均值为 0的正态分布。 举例n一家连锁 零售商店对它们客户的购买习惯进 行

7、了一项调查 ,它记录 了客户性别,购买 模 式、上一个月的购买 金额等信息。该商店需 要了解在控制客户性别的条件下,是否客户 购买 的频率和花费的金额有关系,以此来决 定是否采取相应的促销活动。n打开数据文件grocery_1month.sav。n选择 【分析】【一般线性模型】【单变 量】 绘制选项把style选入水平轴,gender选入单图,然后点击“添 加”。再把style和gender互相交换,选入不同的框中 ,单击“添加”。 结果及其解释(1)结果及其解释(2)结果及其解释(3)男性和女性在每周购物和两周一次购物的均值线是平行的,都是男高女低; 而在经常购物上,二者差距不大,经常购物均

8、值线和另外两条线有交叉,表 明二个因素有交互效应。效应是否显著在“主体间效应的检验”表中标识。结果及其解释(4)男性的所有消费方式的消费金额均大于女性,男性和女性消费方式的曲线 是不平行的,表明二者有交互效应。女性在经常性购物中花费金额最多; 而男性则在每周购物方式中花费最多。 协方差分析(ANCOVA) n既分析控制因素影响,又分析协变 量的影响以 及控制因素和协变 量关系的方法称为协 方差 分析。n协方差分析是针对 在试验阶 段难以控制或者 无法严格控制的因素,在统计 分析阶段进行 统计 控制,它在扣除协变 量的影响后再对修 正后的主效应进 行方差分析,是一种把直线 回归和方差分析结合起来

9、的方法。协方差分析的数学模型n协方差分析的数学模型为这里 表示在控制因素的i水平下的第j次试验 的 因变量观测值 ; 为因变量总体均值; 表示控 制因素的水平i下对因变量产生的效应; 为协 变量的回归系数; 表示在控制因素的水平i下 的第j次试验 的协变 量观测值 ; 为抽样误 差 ,假设它是服从方差相等的正态分布变量。案例分析 政府就业促进部门想了解他们的就业促进项 目是否发 挥了实质 性的作用,他们随机选取了参加该项 目的 人和没有参加该项 目的人,调查这 些人在实施该项 目前后的收入变化。这里研究的目标变 量为参加项 目后人们的薪水,用它来衡量人们找到工作的好坏, 即变量“incaft”

10、(参加项目后的薪水)为因变量。由 于参加该就业促进项 目之前人们的薪水是不同的, 如果不考虑该 因素,直接比较参加项目之后人们薪 水的区别是不合理的。因此把参加该项 目前人们的 薪水(incbef)作为协变 量,把是否参加就业促进项 目 (prog)作为控制因素,即自变量。 对协变量和控制因素的分析n在进行协方差分析之前,一般要先检查进 行 协方差分析的前提条件是否满足。协变 量和因变量之间是否有线性关系可以通 过绘 制散点图来直观的观测 二者之间线 性关 系的强弱。n控制因素和协变 量之间是否有交互作用可以先预先进行方差分析检查 二者之间的交互 效应是否显著。 协变量和控制因素散点图n选择

11、【分析】【一般线性模型】【单变 量】n把“incaft”选入“因变量(D)”框中;把变量“prog”选入“固定因子(F)”框中,把“incbef”选入“协变 量(C)”框中。 设置因子模型结果及其解释动手练习得克萨斯州的一所大学提出了三种GMAT辅导课 程:即3小时复习 、1天课程和10周强化班,他们需要了解这三种辅导 方式如何影 响GMAT成绩。另外,通常考生来自三类院校,即商学院、工学 院、艺术 与科学院。因此,了解不同类型学校毕业 的考生GMAT 成绩是否有差异也是一个让人感兴趣的话题 。他们在三类学校中 每一个随机抽取6个学生,随机指派两名到一门辅导课 程中,最 后他们的GMAT成绩结 果记录 于数据文件GmatScore.sav中。 问 题为 : 1) 不同的辅导课 程是否对学生GMAT的成绩有显著的影响?来自不 同类型学校的学生的GMAT成绩是否有显著的差别?请给 出理由 。 2) 是否一类学校的考生适应一种辅导课 程,而另一类学校的考生适 合其他课程?请给 出理由。本章小结n方差分析本质上是多个总体均值的比较。根据 控制因素个数的不同,方差分析分为单因素方 差分析、多因素方差分析等。本章介绍了方差 分析的基本思想、术语,单因素方差分析、多 因素方差分析的方法和技巧。另外,本章同时 介绍了协方差分析的方法和技巧。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号