心理统计学8方差分析final

资源描述

《心理统计学8方差分析final》由会员分享，可在线阅读，更多相关《心理统计学8方差分析final（157页珍藏版）》请在金锄头文库上搜索。

1、心理与教育统计学,陈启山华南师大心理系 ,方差分析,缘起与实例逻辑概念与分类,1 方差分析的一般问题,1.1 缘起,2个样本平均数可用 t 检验评定其差异的显著性。如果有K(K3)个平均数，若用两两比较的方法来检验，则需作K(K-1)/2次检验，不但程序繁琐，而且其可靠度降低：如6次检验H0的概率是0.95时的误差为：1-0.956 =0.265。对于多样本平均数的假设检验，需采用一种更为合适的统计方法，即方差分析法(Analysis of Variance , ANOVA)。,问题：为什么一个比较均数差异的方法竟称为方差分析？,这种命名是因为在检验均数间差异是否具有统计学意义的

2、过程中，我们实际上是通过比较方差而得到的。与t 检验直接比较两组的平均数的做法不同，方差分析把“平均数之间差异是否显著”的问题转化为“平均数组间变异是否显著”的问题，通过“组间变异”与“组内变异”的对比，进行F 检验，从整体上同时比较多组的平均数之间是否存在显著差异。,方差分析由英国统计学家R. A. Fisher首创，为了纪念他，以F 命名，故方差分析又称 F 检验。,几乎独自建立现代统计学的天才,Fisher从小视力严重受损，不能在人工光线下看东西，却发展出强大的几何直觉能力，解决了大量数理统计难题(别人几个月或几年时间才能证明)。他教学没耐心，因为学生理解不了他认为很明显的事情。 Ka

3、rl Pearson故意贬低Fisher的成果(嫉妒?)，闹得二人彼此很不爽，Fisher在Biometrika上发表了两篇文章时就闪人了，把自己的文章都发到别的刊物上。罗森斯特农业站，作物收成变动研究(16)(标题不起眼，内容很重要)。据说文1中的一张表就要花近200个小时去摇带曲柄的机械计算器(是体力活，我们真幸运)。文2中方差分析第一次面世。文3 包含了现代统计方法的基础。文4介绍了协方差分析。文6提出了实验设计的精华。在Fisher的实验设计提出之前，科学家浪费了好几十年时间在无谓的实验和争论上。,Fisher，几乎独自建立现代统计学的天才。但他也是人，如他与E.Pearson的私

4、交。小皮尔逊一是代父受过，二是代合作伙伴Neyman受过(假设检验的理论就是这二人提出完善的)。 Neyman对Fisher一味遮掩却没有真正解决的某些问题提出了质疑。Fisher在1962年去世前一直批评他，批评他做的每一件事。,1.2 我们常探讨类似这样的问题,选取3种教养方式，探讨教养方式对亲子关系的影响。需要比较3种教养方式下亲子关系均值是否相等。探讨亲子关系如何受父母的教养方式(3种)与子代性别的影响，或者说教养方式对亲子关系的影响是否受子代性别的调节(mediate)。有几个组？ 1. 需暂不理会性别，比较3种教养方式效果的差异 2. 需暂不理会教养方式，比较子代性别的效应

5、3. 需同时考虑教养方式和子代性别，看教养方式的效果在不同性别间是否一致。,怎么解决这些问题？,交给ANOVA吧。透漏一下它是如何解决这些问题的,ANOVA的解决方案：问题1,3组儿童接受不同的教养方式，最后测量亲子关系(可求得各组的均值和总体均值)。组均值偏离总体均值的变异是组间变异；各组内各个被试偏离组均值的变异是组内变异。前者是实验处理引起的，后者视作误差。如果组间变异远大于组内变异，说明各组的亲子关系得分不同。,ANOVA的解决方案：问题2,儿童先分男女2组，各组再按教养方式分组，共可得6组，最后测量亲子关系。所有被试亲子关系得分的变异可分为以下几部分：教养方式引起的、子代性别

6、引起的、教养方式和子代性别的交互作用、误差。前三者是实验处理引起的。比较各实验处理相对于误差的大小，可以推断各实验处理是否对观测值有影响以及影响的大小。,为什么他们的亲子关系各不相同？,随机情况教养方式的影响教养与性别的影响,变异的分解,1.3 方差分析的逻辑,方差分析不仅是一种统计方法，还是一种研究方法和研究思路。它与实验设计(experimental designs)紧密相连。把观察值的总变异分解为两个或多个部分，除随机误差外，其余各部分变异可由某个或某几个因素或它们的交互作用来解释。F 分布的统计推断可阐明某一或某些因素或因素间交互作用是否对观察值有影响。,1.4 几个基本概念,

7、(1)因素(factor)：由研究者掌握的设想为原因的变量。一种是由研究者主动操纵而变化的变量，如教学方法、刺激强度；另一种是研究者主动选择而变化的变量，如性别、年级。在实验中，因素都作为类别变量来测量。 (2)水平(level)：因素所处的状态或等级。 (3)实验处理(treatment)：每个因素各取一个水平得到一个水平组合。也称为单元格(cell)。,(4)主效应(main effect)与交互作用(interaction)：忽略其他因素各水平的差异，由一个因素的不同水平引起的变异叫因素的主效应。因素A的各个水平在因素B的不同水平上的变化趋势不一致时，即表明二者存在交互作用。 “种瓜得瓜

8、，种豆得豆” “橘生于南则为橘,橘生于北则为枳”,(5)离均差平方和(sum square of deviations from the mean, SS)：每个样品的观测分数与均值之差的平方的总和。,(6)自由度(degree of freedom, df)：以样本统计量来估计总体参数时，样本中独立变化的数据个数。,(7)均方(mean square, MS)：离均差平方和与自由度的商，即方差。,用原始数据求SS,1.5 方差分析的分类,与实验设计相连，错综复杂：,独立组 vs. 相关组设计完全随机 vs. 随机区组设计单因素 vs. 多因素设计被试间, 被试内, & 混和设计重复测

9、量 vs. 非重复测量设计其他,根据实验控制的方式进行分类,2 单因素完全随机设计的方差分析,实验设计方差分析 SPSS操作,2.1 单因素完全随机实验设计(complete randomized design, CRD),适应情形：只有一个自变量，有2个或2个以上的水平。基本方法：被试随机分配给自变量的各个水平，每个被试只接受一个水平的处理。误差控制：随机化,研究实例 1.噪音(高/中/低)对数学问题解决的影响 2.反馈(精确/粗略/无反馈)对学习成绩的影响 3.维生素C(安慰剂/高/低剂量)治疗感冒的效果 4. ,数据模式,模型与假设平方和的分解和F 检验效应值事后比较前提

10、假设,2.2 单因素方差分析逻辑与步骤(One-Way ANOVA),2.2.1 模型与假设,模型表达式统计假设 H0: a1=a2=an H1: 至少两组不等,2.2.2 平方和的分解与F检验：实例,一个模拟的单因素3水平的研究,求总(total)平方和：假定所有被试为一组。求组内(within groups)平方和：分3组，每组有一个离差平方和，3个组的平方和相加。求组间(between groups)平方和：各组均值与总体均值的离差平方和，因为每个均值由5个人平均而来，故应乘以5加权处理。,求自由度求均方(方差) 做F检验(单/右侧),如果均值相等，F=MSA/MSE1,列方差分

11、析表组间变异体现了因素A的效应，组内变异则被视作误差。,2.2.2 效应值的度量(effect size),实验处理引致的效应的大小或者数据的变异有多少部分是由实验处理造成的。 Eta平方偏Eta平方 Omega平方 Cohens f,Eta平方(Eta-Squared,2)，又称关联强度(correlation ratio)，因变量的变异被自变量解释的百分比。偏Eta平方(partial Eta-Squared,p2)，多因素ANOVA中，扣除了其他自变量后某自变量的效应。判断标准：0.01，小；0.06，中；0.14，大,Omega平方(Omega squared,2) 当F显著时

12、，2将会是正值，若为负，则要解释为0。当样本很大而使MSw变得很小，F很容易达到显著，此时若2很小，即使在统计上有意义，实际应用上仍然没意义。,Cohens f f f .25，中；f 0.40，高,2.2.3 多重比较(multiple comparisons),事先比较(priori/planned comparison) 事后比较(posteriori/post hoc comparison),事后比较,F检验显著说明各组均值并不相同(至少两组不同)，但不能回答到底哪几组不同。通过对各组均值之间的配对比较来进一步检验到底哪些均值之间存在差异。方法众多，不下20种。,LSD (费舍最小

13、显著差异法, Fishers least significant difference) 该方法是对检验两个总体均值是否相等的t检验方法的总体方差估计加以修正(用MSE代替)而得到的。,S-N-K(Student-Newman-Keuls, q检验) 首先把各组均值排序，用每一比较的两个均值在排序序列种相差的等级数来确定不同的q 临界值。,两均值的rank之差,Tukey法与SNK法类似，不同之处在于不论各组均值的大小次序，均使用同一临界值。,组数,思考：同一个研究，用S-N-K和Tukey法做事后比较，谁更容易得到显著性结果？,Bonferroni校正(以t 分布作为检验分布,对检验水准进

14、行调整) 若在同一数据上同时检验n个独立的假设，那么用于每一假设的显著水平应为仅检验一个假设时显著水平的1/n。如，在同一数据上检验2个独立的假设，此时用于检验该两个假设应使用0.025。这是因为：在同一数据上进行多个假设的检验，每20个假设中就有一个可能纯粹由于概率而达到0.05的显著水平。在比较的次数较多时，该方法就不太适合。,Sidak Scheff Duncan 其他,事后检验小结,研究者可以同时选用多种方法对比检验结果。如果检验结果不一致，可以看看样本均值是否有实质性差异，如果有实质性差异，则选择报告差异显著的检验方法及其结果。,(1)总体服从正态分布。心理研中大多数变量可以假定

15、服从正态分布。而且方差分析对分布假设有稳健性(robust)，即正态性不满足时，统计结果变化不大，因此一般并不要求检验总体的正态性。 (2)变异可加性。各因素对离差平方和的影响可以分割成几个可以加在一起的部分。 (3)独立性。被试随机选取，因变量彼此独立。,2.2.4 方差分析的前提条件,(4)方差齐性(homogeneity of variance)，也称变异的同质性，即各组样本所来自的总体的方差相同，这是方差分析一个很重要的前提，因此在进行方差分析之前，应当进行方差齐性检验。若方差齐性的假定不满足，可考虑如下策略： a.检查某些表现“特殊”的观测值，看能否将其剔除，用剩下的数据进行方差分

16、析。 b.使用无方差齐性假设的多重比较方法。 c.数据变换，用变换(平方根变换、对数变换)后的数据进行方差分析。,方差分析的目的是通过检验多组的均值差异是否显著，来推论实验因素的效应是否显著，即实验因素是否影响因变量。通常需要用方差分析表来报告方差分析结果。,2.2.5 方差分析结果的解释与报告,如果F值不显著，则不拒绝H0。此时可以说“各组均值差异不显著”或“因素A各水平上的均值差异不显著”，“即因素A对Y的影响不显著”。如果F值显著，则拒绝H0。此时可以说“各组均值差异显著”或“因素A各水平上的均值差异显著”，“即因素A对Y的影响显著”。然后是报告多重比较检验结果，说明哪些组之间差异显著，谁高谁低。,请自己总结 1. 2. 3. 4.,2.2.6 小结：方差分析的步骤,2.3 SPSS操作,实验设计方差分析,3 两因素完全随机设计的方差分析,3.1 两因素完全随机实验设计,适应情形：有2个自变量，自变量A有

展开阅读全文