spss5.6方差分析剖析

上传人:今*** 文档编号:107174786 上传时间:2019-10-18 格式:PPT 页数:57 大小:1.69MB
返回 下载 相关 举报
spss5.6方差分析剖析_第1页
第1页 / 共57页
spss5.6方差分析剖析_第2页
第2页 / 共57页
spss5.6方差分析剖析_第3页
第3页 / 共57页
spss5.6方差分析剖析_第4页
第4页 / 共57页
spss5.6方差分析剖析_第5页
第5页 / 共57页
点击查看更多>>
资源描述

《spss5.6方差分析剖析》由会员分享,可在线阅读,更多相关《spss5.6方差分析剖析(57页珍藏版)》请在金锄头文库上搜索。

1、2.6 方差分析,方差分析的概念与方差分析过程 (一)方差分析的概念 方差分析是检验两个或多个样本均数间差异是否具有统计意义的一种方法。 1、方差分析原理 方差分析的基本原理是认为不同处理组的均数间的差别基本来源有两个: (1)随机误差,例如测量误差造成的差异,称为组内差异。用变量在各组的均值与该组内变量值之偏差平方和的总和表示。记作L组内。 (2)实验条件,即不同的处理造成的差异,称为组间差异。用变量在各组的均值与总均值之偏差平方和来表示。记作L组间。 L组间、 L组内除以各自的自由度得到其均方值即组间均方和组内均方, MS组间、MS组内。,一种情况是处理没有作用,即各样本来自同一总体。MS

2、组间MS组内1,考虑抽样误差的存在,则有MS组间MS组内1。 另一种情况是处理确实有作用。组间均方是由于误差与不同处理共同导致的结果,即各样本来自不同的总体。那么组间均方会远远大于组内均方。 MS组间 MS组内。 MS组间/ MS组内构成F分布。用F值与其临界值比较,推断各样本是否来自相同的总体。 2、方差分析的假设检验 假设有m组样本,原假设H0:样本均数都相同, 即1 2 3 m= , m组样本有共同的 方差2。则m组样本来自具有共同的方差2相同的均数的总体。 如果经过计算结果组间均方组内均方得FF0.05(f组间,f组内),则p=0.05, 承认原假设,样本来自相同总体,处理无作用。,(

3、二)方差分析中的术语 1、因素与处理 因素是影响因变量变化的客观条件;处理是影响因变量变化的人为条件。也可通称为因素 。在要求进行方差处理的数据文件中均作为分类变量出现。 2、水平 因素的不同等级称作水平。 3、单元 在方差分析中Cell指各因素的水平之间的每一个组合。 4、因素的主效应和因素间的交互效应 如在研究双因素方差分析问题中,有A、B两种处理方法,实验分为四组,具体方案是: 第一组:不进行任何处理;第二组:进行A处理; 第三组:进行B处理;第四组:A、B两种处理共同进行。,(1)比较第二组的均值与第一组的均值是否有显著差异。 (2)比较第三组的均值与第一组的均值是否有显著差异。 这两

4、项研究的是A、B两因素的主效应。 (3)除了比较第四种的均值与第一组的均值是否有显著性差异外,还要研究A因素对B因素是否有影响。若A因素对B因素无影响,那么除采样误差外,第四组与第二组均值之差应该等于第三组均值减去第一组均值。否则两因素则相互影响,称之为交互效应。如果交互效应存在,说明两个因素不是相互独立的。 5、均值比较 均值的相对比较是比较各因素对因变量的效应的大小。例如研究A、B效应之和是否等于它们的交互效应。或研究A、B的效应是否相等。 均值的多重比较是研究因素单元对因变量的影响之间是否存在差异性,例如研究1、2、3、4组实验之间是否存在显著性差异。,6、协方差分析 在一般进行方差分析

5、时,要求除研究的因素外应该保证其它条件的一致。如研究身高和体重的关系时要求按性别分别进行分析。这样则可消除性别因素的影响。要消除性别的影响,应该采用协方差分析。 (三)方差分析过程 SPSS提供的方差分析过程有: 1、单因素 ANOVA过程 单因素 ANOVA过程是单因素简单方差分析过程。它在菜单“分析 比较平均值”过程组中。可以进行单因素方差分析、均值多重比较和相对比较。 2、一般线性模型(简称GLM)过程,单变量: 单因变量、多因素方差分析。 多变量:多变量、多因素方差分析。 重复测量:重复试验方差分析。 方差分量估计:方差成份分析。,5.6.1 单因素方差分析 单因素方差分析能检验一个因

6、素在多种方案(称在不同水平)下的均值是否有显著性差异。前提是要求各组样本相互独立,都服从正态分布且方差相同。 例5-6-1 某湖水不同季节氯化物含量测定值如下(e5-6-1.sav),试分析不同季节氯化物含量有无差别? 春:22.6 22.8 21.0 16.9 20.0 21.9 21.5 21.2 夏:19.1 22.8 24.5 18.0 15.2 18.4 20.1 21.2 秋:18.9 13.6 17.2 15.1 16.6 14.2 16.7 19.6 冬:19.0 16.9 17.6 14.8 13.1 16.9 16.2 14.8 操作步骤如下:,1、,2、根据分析要求指定方

7、差分析的因变量和因素变量。 3、按确定按钮(其它按SPSS默认值),结果分析:因F=9.380 , p=0.0000.01,在1%显著水平下拒绝H0假设。所以不同季节氯化物含量有显著差别。,单因素方差分析的选择项 1、对比:均值的多项式比较。通过本选项可对各水平均值之间的多项式组合进行比较。 如果假设被研究因素有四个水平,它们的均值依次为M1、M2、M3、M4,设检验的原假设为: a1M1k+a2M2k+a3M3k+a4M4k=0 检验前应在1,2,3,4,5中选定k的值,再按要求选定a1、a2、a3、a4的值。 例如:2M1M40 H0:第一水平均值的2倍与第四水平的均值相等。 M1M2M3

8、M40 H0:第一水平、第四水平的均值和与第二水平、第三水平的均值和相等。 均值的多项式比较的对话框如下:,(1)选择“多项式” (2)确定k的值:度 (3)为多项式指定各水平均值的系数,2、事后多重比较:指定一种多重比较检验。如果通过检验,已经确定各水平的均值之间存在显著性差异,那么再用“事后多重比较”就能确定其中任取的两个水平的均值是否也存在显著性差异。,均值的多重比较表,均一子集表,说明:在均一子集表同一列中的样本均数之间无明显差异。,均数多重比较的方法中: 输出均值的多重比较表的方法有: Tukey, Hochbergs, Gabriel , Scheffe, Bonferroni,

9、Sidak, Dunnett, LSD, Tamhanes T2, Dunnetts T3, Games-Howell, Dunnetts C 输出均一子集表的方法有: Tukey, Hochbergs, Gabriel, Scheffe, Tukeys-b,S-N-K, Duncan, R-E-G-WF,R-E-G-WQ,Waller-Duncan,3、选项:指定要输出的统计量及处理缺失值的方法。,描述性:要求输出描述统计量,包括:观测量数目、均值、标准差、标准误、最小值、最大值、均值的置信区间。 方差同质性检验:要求进行方差齐次性检验,并输出检验结果。 平均值图: 要求输出均数分布图.,例

10、5-6-2 设有5种培训方案,要比较它们的效果。假定将30人分成5组,每组6人,令同一组人使用同一组培训方法。培训后各人的日产量如下: 培训方案 日产量 1 5,8,7,7,10,8 2 4,6,6,3,5,6 3 6,4,4,5,4,3 4 7,4,6,6,3,5 5 9,3,5,7,7,6 操作:(e5-6-2) 对比:M1-M2+M3-M4, M1-M3+M4-M5 事后多重比较: LSD、Duncan(方差相等) Tamhanes T2 (方差不相等) 选项: 描述性, 方差同质性检验 , 平均值图,描述统计量结果分析表,方差齐次性检验结果表,方差齐次性检验结果表中, F=0.552,

11、 P=0.6990.05,因此接受方差齐次的假设。,单因素方差分析表,在单因素方差分析表中,F=3.896, P=0.0140.05, 因此拒绝假设H0。说明5种培训方案对提高日产量有显著差异。,多项式比较系数表,多项式比较检验结果表,前面已接受方差齐次性的假设,所以选择Assume equal variances. 因contrast 1: P=0.1940.05, 所以1、3培训效应和与2、4培训效应和无明显差异。 因contrast 2: P=0.0950.05, 所以1、4培训效应和与3、5培训效应和无明显差异。,均值的多重比较结果表,在均值的多重比较结果中,由于已接受方差齐次性的假设

12、,所以不必考虑Tamhane法所得结果。在LSD法所得结果中,可以看出1与2,1与3,1与4,3与5培训之间的差异显著。而1与5,2与3,2与4,2与5,3与4,4与5培训之间的差异不显著。,均一子集表,在均一子集表中,第一均一子集为2、3、4和5培训方案,说明2、3、4和5培训方案之间无明显差异。第二均一子集为1和5培训方案,说明1和5培训方案之间无明显差异。 由上面分析可知,利用Duncan法和LSD法得到的结论是不同的,LSD侧重于两两均值的比较,而Duncan是从一个子集的概念来说明不同水平间均值的差异情况。,不同水平的均值分布图,5.6.2 一个因变量的多因素方差分析 本节要研究的是

13、单响应变量多因素方差分析的SPSS实现过程,特别是单响应变量双因素方差分析问题。 例5-6-3 设A、B、C 3台机器生产同一产品,4名工人操作机器A、B、C各一天,得日产量数据(e5-6-3.sav)如下:,问机器之间、工人之间在日产量上是否有显著差异(0.05)?,操作步骤: 1、,2、选择因变量。 3、选择固定因素变量 4、根据实际需要选择随机因素变量、协变量、加权变量,5、“模型”选项:,全因子,包括所有因素变量的主效应和所有的交互效应。 定制,由用户选择因素变量的主效应和交互效应。 平方和: 选择分解平方和的方法。 在模型中包含截距:选此项,表示截距包括在模型中。,6、“对比” 选项

14、:,因子框:显示主对话框中选中的因素变量及对照方法。 更改对比: 改变对照方法。 无: 不进行均值比较。 偏差: 比较因素每个水平的效应,选择最后一个或第一个作参考水平。,简单:因素变量的每一水平都与参考水平进行比较。 差值:因素每一水平的效应,除第一水平外,都与其前面各水平的平均效应进行比较。 Helmert:因素每一水平的效应,除最后水平外,都与后续的各水平的平均效应进行比较。 重复:对相邻水平进行比较。 多项式:多项式比较。 7、“绘图”选项: 它可以一个或多个因素变量为参考作因变量的均值分布图。,因子:显示主对话框中选中的因素变量。 水平轴:横坐标框 单图:分线框 多图: 分图框,8、

15、“事后多重比较”选项,9、“保存”选项:可以将所计算的预测值、残差和检测值作为新的变量保存在数据集或数据文件中。,10、“选项”:,结果与分析,因素变量为机器和工人 机器有三个水平:1、2、3,每个水平共有4个观测量。 工人有四个水平:1、2、3、4,每个水平有3个观测量。,主效应方差分析检验结果,因素A:F=29.102,P=0.0010.05, 按0.05检验水平,拒绝无效假设,可以认为机器之间差异显著。 因素B:F=6.985, P=0.0220.05,按0.05检验水平,拒绝无效假设,可以认为工人之间差异显著。,机器变量均一子集:第一均一子集包含机器的第三水平和第一水平,它们的均数分别

16、为45.75和49.25, P=0.079, 按0.05检验水平,接受无效假设,可认为机器C、A的日产量的均数之间无明显差异。 机器B与它们的差异较显著。,工人因素变量均一子集表: 第一均一子集包含工人2、3、4,它们的均数分别为47.67, 48.33, 53.00, P=0.070, 按00.05检验水平,接受无效假设,可认为工人2、3、4日产量的均数之间无明显差异。 第二均一子集包含工人4、1,它们的均数分别为53.00, 55.00, P=0.335, 按00.05检验水平,接受无效假设,可认为工人4、1日产量的均数之间无明显差异。 工人1和工人2、3没有出现在同一均一子集中,可以认为它们的均数存在显著差异。,例5-6-4,某企业在制定某商品的广告策略时,收集了该商品

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号