第4章 方差分析实验设计和分析

上传人:工**** 文档编号:488779445 上传时间:2023-10-24 格式:DOCX 页数:12 大小:114.18KB
返回 下载 相关 举报
第4章 方差分析实验设计和分析_第1页
第1页 / 共12页
第4章 方差分析实验设计和分析_第2页
第2页 / 共12页
第4章 方差分析实验设计和分析_第3页
第3页 / 共12页
第4章 方差分析实验设计和分析_第4页
第4页 / 共12页
第4章 方差分析实验设计和分析_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《第4章 方差分析实验设计和分析》由会员分享,可在线阅读,更多相关《第4章 方差分析实验设计和分析(12页珍藏版)》请在金锄头文库上搜索。

1、第4章方差分析(ANOVA )实验设计和分析Catherine Potvin4.1生态学问题弄懂生态学问题需要将各种环境因子的影响分开,生态工作者用实验来解决这个问题。 不论在野外还是在控制环境条件下,可控实验都可以让生态工作者们只变化一个因子来检验 其影响。例如,生长箱能使生物体生长在完全相同的温度而不同的光周期的条件下,或相同 的光强而不同温度条件下的实验成为可能。在控制实验中,通常最希望的情况是环境背景, 即所有的影响因子,不是自由地变化,而是精确地得到控制,这样就能够保证在改变目标变 量时,观测的反应不会受到其它因素的影响。因而控制环境条件,例如使用生长箱和温室, 成为植物生态学的一个

2、常用的方法,如同动物生态学中使用的生长柜和水族槽一样。本章第一部分,我要讲一下作为实验生态学基本工具的方差分析(ANOVA)。本章重 点放在实验设计上。虽然人们一般认为生长箱会提供同一环境条件,但不论在一个生长箱内 还是生长箱间都存在环境异质性(Lee和Rawlings 1982; Potvin等1990a),因而能够充分 处理环境异质性的实验设计将在本章中述及。尽管我的论述主要是以生长箱实验为基础,其 原理在其它类型的控制或野外环境的实验研究中同样适用(第5, 15和16章)。我还要讨论 错误实验设计的代价。本章应视为实验设计的起步点,这个起步点就是要考虑各种影响因素。 实验者通常进行的实验

3、比这里展开的要复杂。但是一旦懂得了基本原理,讨论各种实验设计 就相对简单一些。更详细的论述请见Cochran & Cox( 1957)和Winter(1991)O4.2统计问题:环境变化与统计分析正如Underwood(1997)建议的一样,生态实验设计的第一步是建立一个线性模型使研究 者能够将感兴趣的变量(因素)独立出来。由于实验设计支配误差项,建立线性模型取决于 所研究的因子以及具体的实验设计。在任何一个实验开始时,最基本的是要检验空间与时间 变化的格局。实验设计为处理这类无其它办法可控制的变异性提供了办法。因而,一个好的 实验设计会减少实验误差。检验不同的实验设计有助于选择合适的设计。并

4、且将与各种变化 来源有关的自由度清楚地分开。因而选择正确的实验设计对防止类似假重复和相互干扰的问 题来说至关重要(Hurlbert 1984)o本章所讨论的内容要求读者对方差分析(ANOVA)有一定 的基础知识,从而我可以讨论一些方差分析中不太常见的方面。方差分析统计处理的细节可 见 Sealer(1971)。方差分析(ANOVA)使用抽样数据来检验关于总体的假设。基于特定线性模型的方差 分析将方差分配到各影响因子(通常是处理)。一个因子可以划分成任意数目的等级(Sealer 1971)。线性模型中描述数据的参数可由一些技术如最小二乘法或最大似然值等方法来估计。 传统上用于ANOVA的最小二乘

5、法估计值将观测数据与期望数据离差的平方和最小化(Sealer 1971)。在最小二乘法分析中,如果数据组是平衡的(即每一分析组(cell)观测数相 等),则离差平方总和能很容易被分解为实验设计中各因子所分别贡献的平方和(SS)。离 差,作为余值则是观测值与均值之差。这种结果是具最小方差的无偏估计值,这是估计值的 上佳性质(Winter等1991)。均方(MS)是每自由度的平均变异,由平方和除以自由度(SS/df) 得出。在此意义上,均方和统计方差等价。每一个计算出来的均方都有一个相对应的期望值, 表4.1表示一个均方的期望值是方差成分的线性组合。在ANOVA中假设检验所依赖的统计 量F,由两个

6、均方的比值得出。因而,探测兴趣所在因子的影响概率依赖于正确使用误差项。表4.1 一因子方差分析(ANOVA)*的期望均值平方与F-比值影响期望均方F-比值AAinb / b 2 + a 2i=1MSA/MSeBjna .八 b 2 + p 2j=1MSB/MAeABijb2 +n b (aP)2e (a T)b T)i=1 j =1MSAB/MSe余值(误差)b 2eBAib 2 + nb 2 + nbb 2MSA/MSABBjb2 + nb 2 + nab 2MSB/MSABABijb 2 + nb 2eABMSAB/MSe余值(误差)b2e*A)固定影响分析模型,B)随机影响分析模型误差项

7、的重要性可由下例说明:ANOVA的基本理论承认两类影响:随机影响与固定影 响有本质上的区别。我们可将一个随机因子的水平视为从一个大的确定的集合随机抽取的, 而固定因子的水平则是由实验者特意选取的。从生物学上而言,影响是固定的还是随机的在 进行推论上是重要的。如果影响被认为是固定的,其研究结果就不能推广到研究水平以外。 因为所检验因子的水平是特意选择的。如果要将一个处理因子推广到其它水平,该因子的影 响就一定要被认定为是随机的。增加大气中CO2浓度的研究为固定因子影响提供了一个清 楚的例子。研究者通常比较当前CO2水平(350ml/l)的影响与预测的21世纪中期的倍增浓 度(650ml/l)的影

8、响(研究者通常将当前CO2水平(350ml/l)与预测的21世纪中期的倍增 浓度(650ml/l)的影响进行比较)。在这些实验中,人们并不企图将结果扩展到其它的CO2 浓度。然而,如果实验着重于Arabidopsis (拟南芥属)各种基因型对升高的CO2浓度的反 应,最可能的是这些基因型从代表Arabidopsis各种基因型的种群随机选出,所以基因型影 响应是随机的且实验的结果可以扩展到整个Arabidopsis的各种基因型。当数据组是平衡的,即该数据组的每一分析组均具有相同的样本大小,不论因子是固 定的还是随机的,其平方和与均方的计算均是一致的(Harr 1986)。但是均方的期望值是不 同

9、的,这一点非常重要,因为F比值是由均方期望值决定的。最简单的例子就是由表4.1所 表示的双因子方差分析模式。在附录4.1中,我们给出了方差分析的SASCSAS研究所,1989a b)计算机程序。在固定模型中,每一因子的均方期望值是误差方差与该因子的恒常影响之 和。因此,用于计算F值分母的合适均方总是误差均方。在随机模型中,对每一主要影响 均方的期望值是误差方差、相互作用方差以及检验因子影响方差之和。因此,对主要因子的 F-检验要用相互作用均方为分母,而相互作用影响则要用误差方差为分母来检验。在三相 (three-way)(或更高)随机,混合或固定阶乘(Factorial)模型中,作为F-检验用

10、于分母的常常是一些均方值的组合(Winter等1991)。由于人们常用的统计软件一般默认用误差方 差来衡量所有因子,我在这里要强调均方期望值在确定适当的显著性检验所起的重要作用。 不管是否合适,软件的默认配置仅对固定模型有效。本章剩下各节将展示一些不同的实验设 计并给出适当的误差项,我将着重讨论选择错误的误差项所能导致的分析偏差。4.3统计方法:设计实验数据分析取决于实验设计本身以及如何将各感兴趣因子的各水平分配到各实验单元。 一般来说,实验误差越小,设计就越有效。设计实验还涉及到选择的样本大小以及实验在时 间、空间上的设置。大量不同的标准实验设计已经存在,每一种都跟着一个数学模型和分析 方法

11、。这里,我只讲两种这类设计 以及它们各自如何对特定变异格局进行处理。这些设计 在生态实验中很典型。处理各种特定问题的其它设计请见Cochran和Cox(1957),Winter 等(1991)以及 Underwood(1997)。在控制实验中,不同实验单元接受不同水平的处理因子。由此假定实验单元间的差别 代表这些因子水平的区别(Hurlbert 1984)O在不同实验单元上随机分配因子水平和处理重 复是一个良好实验设计的基本保证。罗纳德费舍尔爵士(1935)就是随机化的坚定鼓吹者。 他令人信服地指出随机化是对抗变异来源混乱的保证。假定我们要比较三种植物的光合作 用,且取样安排在早10点到下午4

12、点的3个两小时时间段内。一个好的设计会随机地将各 物种分配到每一取样日的不同时间段内。错误的设计会系统地把种A放在上午量测,种B 放在中午而种C放在下午量测。这样,各种光合作用率就会与每日取样时间相干扰,而统 计检验推论无法告之导致光合速率不同的原因是由于物种不同呢,还是由于取样时间的不 同。好的实验设计的第二个基本保证是重复。费舍尔(1971)指出,重复有两种目的:“在 不同样地重复实验处理在于它是一种提高实验比较精度的方法,其主要的目的是提供误差的 估计,这是其它办法无法替代的,这种误差估计是用于确定比较显著性所依赖的。” Hurlbert (1984)引入“假重复”一词并定义为“使用推论

13、统计时利用实验数据来检验处理因子影响, 而实验中处理没有重复或重复在统计上不独立。” Hurlbert文章的核心强调实验布局的假重 复。然而,通常发生的是实验布局很合适而在数据分析上出问题,因为研究者无法判断实际 的实验单元或重复,因而使用不合适的误差项。4.3.1区组将相似实验单元组成区组能调节环境异质性并提高统计效力。与随机主张一致(Fisher 1971),处理因子的每一水平都要在每一区组内随机分配给不同的实验单元。在随机区组设 计中,实验单元分配到各环境相对恒定的区组中。区组内各实验单元的差异提供了对处理影 响的量测,而区组的重复提供处理的重复。这种设计使我们能够将随机离差分配到处理因

14、子 项,实验误差项以及不希望的环境(区组)影响项。最终实验误差项会比较小,从而该设计 比完全随机设计更有效。在传统随机区组设计中,处理因子的每一水平随机分配给每一区组中的每个重复项。每一区组内的实验单元数因而与研究的因子水平数相等。这种设计因此可视为ANOVA的一种特别形式一区组内无重复。从而其模型不包括相互作用项。随机区组设计可由下面的线性 X=N+T+B+8 模型描述:泓 i i 泓(4.1)式中、是T处理i水平下的第j实验单元的反应,是该反应的总体均值户i是T处理i水 平的影响,七是j区组的影响,匕k是随机方差或误差。对此设计的SAS程序在附录4.2 中给出。注意均方误差项与区组和处理相

15、互作用项一致(Sokal和Rohlf1995, pp328, 347)。 随机区组设计的期望误差均方(S;+ S:b)与二因子ANOVA的相互作用均方期望值相对 应。类似的完全随机设计可描述为:*+T * j(4.2)对比公式4.1和4.2进一步展示出如果区组设置合理而且各区组有不同的环境条件时,H项 则会由于环境异质性从误差项中移出。其结果是:误差项将减小,使得随机区组设计比完全 随机设计更容易检验出显著的处理影响。传统模型,即公式4.1,无疑假定处理与区组间相互作用不存在。Underwood( 1997) 和Newman等(1997)都批评在野外实验中有此假定。他们争辩说相互作用的存在会使

16、得 对处理影响的检验无效。这种争辩并不新鲜,Kempthorne(1975)说当相互作用存在时,关 于主要因子的总体陈述将没有多大意义。然而,正如Sokal和Rohlf(1995, p336)在许多 例子中清晰阐明的一样,尽管存在相互作用,对主因子影响的总体显著性的检验可能是重要 的。这就值得我们复习一下Sheffe(1959)来弄清楚。作者认为,一个没有相互作用的案例 是个能够简单解释的可加性案例:不管因子B的影响,因子A将同等地影响所有观测值。 然而,如果相互作用的因子存在,因子A的影响将随因子B的变化而变。在受控环境下, 区组常由发芽盘、塑料容器等组成,区组与处理间无相互作用的假定大体成立。在其它情况 下,如野外操作实验中,处理与区组的相互作用是明显的。但是,正如Sheffe(19

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号