方差分析 (analysis of variance)

上传人:wt****50 文档编号:37852958 上传时间:2018-04-23 格式:DOC 页数:8 大小:137KB
返回 下载 相关 举报
方差分析 (analysis of variance)_第1页
第1页 / 共8页
方差分析 (analysis of variance)_第2页
第2页 / 共8页
方差分析 (analysis of variance)_第3页
第3页 / 共8页
方差分析 (analysis of variance)_第4页
第4页 / 共8页
方差分析 (analysis of variance)_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《方差分析 (analysis of variance)》由会员分享,可在线阅读,更多相关《方差分析 (analysis of variance)(8页珍藏版)》请在金锄头文库上搜索。

1、1方差分析方差分析 (Analysis(Analysis ofof Variance)Variance) 考虑以下情境: 一位研究者感兴趣影响儿童阅读能力的因素.研究者认为儿童的年龄和每次 阅读时间可能是重要的影响因素。研究者设计了以下实验:选取三个年龄 组的儿童: 3 岁, 8 岁, 和 14 岁.将每个年龄组的儿童随机分配到三个阅 读条件. 组 1 阅读时间为 5 分钟; 组 2 为 15 分钟; 对于组 3 为 30 分 钟.两个星期之后测试了这些儿童的阅读能力。 阅读时间5 分钟 15 分钟 30 分钟3 岁8 岁年龄 14 岁 这个研究有 3 X 3 样本 (即 9 个). 如何分析

2、数据? t-检验和 z-检验不能用于多于 2 组的数据. 处理这类数据需要 用 一种新的推论统计程序: 方差分析 (ANOVA). ANOVA 能够处理数据的类型: 在上例中有两个自变量 (称为因素): 年 龄和阅读时间. 两个都是组间 (独立样本) 变量. ANOVA 亦可用于分析 包含组内 (重复测量) 因素的研究设计,同时包含组间和组内因素的混 合设计(e.g. 假设上例中我们用同一些儿童作纵向研究。年龄是组内变 量,阅读时间是组间变量). 在方差分析中,因素就是自变量. 包含一个自变量的研究称为单因 素设计(single-factor design). 具有多于一个自变量研究称为 因素

3、设计(factorial design). 构成因素的个别处理条件称为因素的水平. 上述研究称为因素设计, 两个组间因素,每一个因素有 3 个水平 (称为 3 X 3 组间设计). 最基本的 ANOVA.集中讨论单因素, 独立测量的研究设计. 1. ANOVA 的逻辑 2. ANOVA 的符号. 3. ANOVA 的过程和例题 4. 事后检验1. ANOVA 的逻辑 与假设检验的逻辑是同样的, 只是具体内容有变化 step 1: 陈述 H0 (和 H1 ?) ,确定标准: = ? step 2: ANOVA 检验总是 单尾 step 3: 指出检验的 df (有两个 df) step 4: 查

4、表找出临界 F 统计量 2step 5: 对于样本,计算 F 统计量 step 6: 比较 F 统计量 和临界 F 统计量 step 7: 对于 H0 作出结论 单因素, 独立测量研究设计的例子: 检验三个不同的学习方法的效应。将学生随机分配到 3 个处理组 方法 A:让学生只读课本, 不去上课. 方法 B:上课,记笔记,不读课本. 方法 C:不读课本,不去上课, 只看别人的笔记 Step 1: 陈述假设和设定标准 (选择 ) H0: 1 = 2 = 3 H1: 其中一个组与另一个(或更多)的组均值不同。备择假设 可能的 形式很多: 1不等于 2 = 3 1 = 3 不等于 2 1 = 2 不

5、等于 3 1 不等于 2 不等于 3 因此,只需给出虚无假设就够了 step 2: ANOVA 检验总是单尾. 因为不存在负的方差. F 分布表也只有单侧的 Alpha.(F 分布图) step 3: 找出检验的 df. 注意要考虑几个 df ( step 4: 从表找出临界 F 统计量 分子的 df分母的 df 1 2 3 4 5 1161 4052 200 4999 216 5403 225 5625 230 5764 218.51 98.49 19.00 99.00 19.16 99.17 19.25 99.25 19.30 99.30 310.13 34.12 9.55 30.92 9

6、.28 29.46 9.12 28.71 9.01 28.24 : : : : : : : : : : : : 与 t 分布表类似, F 分布表也是描述一族 F 分布. 需要用到两个 df,用一个找出正确的行另一个找出正确的列.上面一行 对应于 = 0.05, 下面一行对应于 = 0.01. step 5: 计算样本 的 F 统计量观测值 概念的水平的讨论: ANOVA 非常类似 两个独立样本的 t 检验 tobs = 得到的样本均值间差异 期望的机会差异 对于 ANOVA 检验统计量 (称为 F 比率) 类似 F = 样本均值间方差 (差异) 期望的机会(误差)方差(差异)为什么用方差? 3

7、因为有多于两个组. 如何计算一个分数来描述差异间分布? 差异不能够分割, 但是方差能够分割。这就是 ANOVA -方差分析名字的由来. 首先考虑方差的来源. 什么造成样本的不同(处理间变异) ? 处理/组效应 - 处理造成的差异 个体差异效应 - 个体差异变异 随机误差 每一个样本内部的变异 (处理内变异) 个体差异效应 随机误差 F 比率 可以表达为: F 比率 =样本均值间的方差 (差异) 期望的机会 (误差)方差(差异) F 比率 =处理间方差处理内方差F 比率 = 处理效应 + 个体差异 + 随机误差 个体差异 + 随机误差注意: 有时分母叫做误差部分,其量度了由于机会造成的方差 如果

8、 H0 为真,处理效应的值应该如何? H0: 1 = 2 = 3 如果没有差异, 效应方差 = 0 如果效应方差 = 0, F 比率值? F 比率 = 0 + 个体差异 + 随机误差 = 1 = 1.0 个体差异 + 随机误差 1如果 H0 为假, F 比率应该大于 1. step 6: 比较 F 统计量的观测值与临界 F 统计量 如果 F 统计量的观测值 (Fobs) 在统计上显著地大于 1.0 则拒绝 H0 2. ANOVA 的专用符号 K = 处理条件(或组)的数目4n = 每一个组的数目(如果它们相等) ni = 第 i 组的数目(如果 它们不等) N = ni = 总的样本容量 Ti

9、 = Xij G = Xij =总的和 G-bar = G / N = 总的均值 SSi = 每一个组的和方 = (Xij - i)2 在上例中: 研究方法 方法 A 只读课本方法 B 只作笔记方法 C 借别人笔记 041 132 362 130 040 T1 = 5T2 = 20T3 = 5 SS1 = 6SS2 = 6SS3 = 4 n1 = 5n2 = 5n3 = 51 = 12 = 43 = 1X2 = 106 G = 30 = 总的和 N = 15 = 总的样本容量 G-bar = 30/15 = 2 = 总的均值 K = 3 =处理条件 (或组) 的数目3. ANOVA 的过程和例

10、题 F 比率 = 处理间方差 处理内方差需要找出两个方差. 最基本公式 s2 = SS/df. SS和 = X2 - (G2/N) SS和 = 106 - (302/15) =106 - 60 = 46 需要将其分解为组间变异和组内变异. SS和 = SS组间 + SS组内 如何得到 SS组内? 将每一个组 SS 相加 SSwithin = SS 每一个 处理内部 = SSi = 6 + 6 + 4 = 16 如何得到 SS组间? 快捷的方法是: SS和- SS组内 若数据足够,不推荐用这种方法,因为: 无法检查计算错误5 未涉及 SS组间 是如何组成. 直接计算 SS组间的两个公式 :定义公

11、式和计算公式 定义公式 计算公式 SS间 = ni( - G-bar)2 SS间 = (T2/ni) - G2/N = 5(1 - 2) 2 + 5(4 - 2) 2 + 5(1 - 2)2 = 5 + 20 + 5 = 30 = 52/5 + 202/5 + 52/5 - 302/15 = 5 + 80 + 5 - 60 = 30 SS和 = SS组间 + SS组内 = 16 + 30 = 46 s2 = SS/df. 已计算出 SS, 找出 df: 共有两个 (或三个) 自由度, 一个组间方差 df,一个组内方差 df (以及一 个总的 df). df和 = N - 1 df组内 = =

12、N - K df组间= K - 1 df和 = df组内 + df组间 在例子中: df组内 = 15 - 3 = 12 df组间= 3 - 1 = 2 df和 = 15 - 1 = 14, = 12 + 2 现在计算方差. 这里称为均方. 方差 = 均方 = MS = SS/df MS组间= SS组间/df组内 上例中 = 30/2 = 15 注意: 有时 MS组间称为误差的均方. MS组内 = MS误差 =误差的均方 = SS组内/df组内 上例中 = 16/12 = 1.33 F 比率 = 处理间方差 = MS组间处理内方差 MSw 组间上例中的 F 比率是: 15/1.33 = 11.

13、28 将结果总结到方差分析表中:来源SSdfMS 处理间30215.0F = 11.28 处理内16121.33 总的4614查 F 表 确定 Fcrit 对假设作出结论 df组间 = 分子的 df df组内 = 分母的 df (误差) 上例中: df组内 = 12; df组间 = 2 分子的 df 分母的 df 1 2 3 4 5 1161 4052 200 4999 216 5403 225 5625 230 5764 6218.51 98.49 19.00 99.00 19.16 99.17 19.25 99.25 19.30 99.30 310.13 34.12 9.55 30.92

14、9.28 29.46 9.12 28.71 9.01 28.24 : : : : : : : : : : : : 124.75 9.333.88 6.933.49 5.953.26 5.413.11 5.06134.67 9.073.80 6.703.41 5.743.18 5.203.02 4.86 : : : : : : : : : : : : 如果选择 = .05, Fcrit = 3.88 如果选择 = .01, Fcrit = 6.93 F 比率的观测值 11.28 大于 Fcrit., 所以拒绝 H0 (1 = 2 = 3).报告结果 F(df组间,df组内) = Fobs, p

15、0.0,不能 拒绝 H0 比较 3: H0: 2 = 3 2 -3 = 4.0 - 1.0 = 3.0 HSD = 1.94 3.88, 拒绝 H0 比较 2: H0: 1 = 3 SS组间= + - = 0 MS组间 = = 0/2 = 0 MS组内 = = 16/12 = 1.33 F 比率 = MS间 = 0/1.33 = 0 MS组内 查 F 表. = .05, Fcrit(2,12) = 3.88 0 3.88, 拒绝 H0 注意: 与 t-检验的关系 差异间独立样本 t-检验与两个水平的单因素组间 ANOVA 有和区别? 没有. F 比率 = t2 差异间 t-检验和 ANOVA, t-检验是考察两个均值间的差异 ANOVA 是考察 方差. 如果只有两个组, t 统计量的平方就是 F 统计量. 例:一位研究者研究三种键盘设计。记录了三组被试的错误次数: 键盘 A: 0 4 0 1 0 键盘 B: 6 8 5 4 2 键盘 C:6 5 9 4 6 键盘类型对打字错误有无显著的影响?

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号