《两因素及多因素方差分析》由会员分享,可在线阅读,更多相关《两因素及多因素方差分析(50页珍藏版)》请在金锄头文库上搜索。
1、第11章 两因素方差分析Two-factor analysis of variance 本章主要内容第一节两因素交叉分组试验资料的方差分析一两因素有重复观察值试验的方差分析二两因素单独观察值试验的方差分析三举例第二节数据转换第一节两因素交叉分组资料的方差分析第一节两因素交叉分组资料的方差分析设试验考察A、B两个因素,A因素分a个水平,B因素分b个水平,所谓交叉分组是指A因素每个水平与B因素的每个水平都要碰到,两者交叉搭配形成ab个水平组合即处理。 特点特点:试验因素A、B在试验中处于平等地位平等地位,试验单位分成ab个组,每组随机接受一种处理,因而试验数据也按两因素两方向分组。一、两因素有重复
2、观察值试验的方差分析一、两因素有重复观察值试验的方差分析1. 1. 主效应与交互作用主效应与交互作用 简单效应 在某因素同一水平上, 另一因素不同水平对试验指标的影响称为简单效应。简单效应实际上是特简单效应实际上是特殊水平组合间的差数。殊水平组合间的差数。表表11-111-1日粮中加与不加赖、蛋氨酸雏鸡增重日粮中加与不加赖、蛋氨酸雏鸡增重(g)(g)A1A2A2-A1平均平均B14704722471B248051232496B2-B1104025平均平均47549217主效应主效应 由于因素水平的改变而引起的平均数的改变量称为主效应。主效应。 如表,当A因素由A1水平变到A2水平时,A因素的主
3、效应主效应为A2水平的平均数减去A1水平的平均数。即 A因素的主效应=492-475=17同理 B因素的主效应=496-471=25主效应也就是简单效应的平均主效应也就是简单效应的平均,如(32+2)2=17 , (40+10)2=25A1A2A2-A1平均平均B14704722471B248051232496B2-B1104025平均平均47549217交互作用交互作用( (互作,互作,interaction) ) 在多因素试验中, 一个因素的作用要受到另一个因素的影响,表现为某一因素在另一因素的不同水平上所产生的效应不同,或者说,某一因素的简单效应随着另一因素水平的变化而变化时,则称该两因
4、素存在交互作用。显而易见,A的效应随着B因素水平的不同而不同,反之亦然。我们说A、B两因素间存在交互作用,记为AB。A1A2A2-A1平均平均B14704722471B248051232496B2-B1104025平均平均47549217互作效应可由 (A1B1+A2B2-A1B2-A2B1)/2来估计。 表111 中的互作效应为: (470+512-480-472)/2=15我们把具有正效应的互作称为正交互作用(协同作用)正交互作用(协同作用);把具有负效应的互作称为负交互作用(拮抗作用)负交互作用(拮抗作用);互作效应为零则称无交互作用无交互作用。没有交互作用的因素是相互独立的因素,此时,
5、不论在某一因素哪个水平上,另一因素的简单效应是相等的。2. 2. 两因素资料方差分析的数据模式两因素资料方差分析的数据模式 P137 表表9-1 按因素的类型两因素或多因素方差分析可分为固定模型、随机模型和混合模型三类,这三类的数学模型、统计假设、统计量的计算、结果的解释等方面有很大差异,我们分别加以介绍3. 3. 固定效应模型固定效应模型 统计模型统计模型其中,为总平均数; i为Ai的效应; j为Bj的效应; ( )ij为Ai与Bj的互作效应; ijl为随机误差,相互独立,服从N(0,2)。且有: 统计假设统计假设备择假设为上述各参数至少有一类不为零总平方和与总自由度的分解总平方和与总自由度
6、的分解SST=SSA+SSB+SSAB+SSe dfT=dfA+dfB+dfAB+dfe 其中SSAB ,dfAB为A因素与B因素交互作用平方和与自由度。各项平方和、自由度及均方的计算公式如下: 均方为 MSA=SSA/dfA MSB=SSB/dfB MSAB =SSAB / dfAB MSe=SSe/dfe 平方和自由度矫正数C=x2/abn总SST=x2ijk -CdfT=abn-1A因素SSA=1/(bn) x2i . .-Cdf A=a-1 B因素SSB=1/(an) x2 .j .-Cdf A=b-1交互作用SSAB=SST-SSA-SSB -SSedfAB=(a-1)(b-1)误差
7、SSe= x2ijk - 1/n x2ij . dfe=ab(n-1)期望均方期望均方统计量统计量F变异来源平方和自由度均 方F 值A因素SSAdfAMSAFA=MSA/MSeB因素SSBdfBMSBFB=MSB/MSe交互作用SSABdfABMSABFAB=MSAB/MSe误 差SSedfeMSe总变异SSTdfT4. 4. 随机效应模型随机效应模型 统计模型统计模型其中要求: i 服从N(0,) ; j 服从N(0,); ( )ij 服从N(0, ); ij 为随机误差,相互独立,服从N(0,2)。统计假设统计假设备择假设为上述各参数至少有一类不为零总平方和与总自由度的分解总平方和与总自由
8、度的分解(同固定效应模型)(同固定效应模型)期望均方期望均方统计量统计量F变异来源平方和自由度均 方F 值A因素SSAdfAMSAFA=MSA/MSABB因素SSBdfBMSBFB=MSB/MSAB交互作用SSABdfABMSABFAB=MSAB/MSe误 差SSedfeMSe总变异SSTdfT5. 5. 混合效应模型混合效应模型(设(设A A为固定因素,为固定因素,B B为随机因素)为随机因素) 统计模型统计模型其中要求: j服从N(0,); ( )ij服从N(0,); ij为随机误差,相互独立,服从N(0,2)。统计假设统计假设 备择假设为上述各参数至少有一类不为零总平方和与总自由度的分解
9、总平方和与总自由度的分解 (同固定效应模型)(同固定效应模型)期望均方期望均方统计量统计量F变异来源平方和自由度均 方F 值A因素SSAdfAMSAFA=MSA/MSABB因素SSBdfBMSBFB=MSB/MSe交互作用SSABdfABMSABFAB=MSAB/MSe误 差SSedfeMSe总变异SSTdfT二两因素单独观察值试验的方差分析二两因素单独观察值试验的方差分析A、B两个试验因素的全部ab个水平组合中,每个水平组合只有一个观察值,全部试验共有ab 个观察值。其数据模式如表112所示。A因素因素B 因因 素素合计合计xi.平均平均B1B2BjBbA1x11x12x1jx1bx1 .A
10、2x21x22x2jx2bx2 .Aixi1xi2xijxibxi .Aaxa1xa2xajxabx a .合计合计x .jx.1x.2x.jx.bx.平均平均交叉分组两因素单独观察值试验数据模式1、两因素单独观察值试验的数学模型两因素单独观察值试验的数学模型 其中,为总平均数; i、 j 分别为Ai、Bj 的效应;且 i=0, j=0;ij为随机误差,相互独立,且服从N(0,2)。 2、平方和与自由度的分解、平方和与自由度的分解两因素单独观察值的试验,全部ab个观察值的总变异可以分解为A因素水平间变异、B因素水平间变异及试验误差三部分;自由度也相应剖分。平方和与自由度的分解式如下: SST=
11、SSA+SSB+SSe dfT=dfA+dfB+dfe 各项平方和与自由度的计算公式为:矫正数矫正数 C=x2./ab总总平方和A因素因素平方和B因素因素平方和误差误差平方和 SSe=SST SSA - SSB总总自由度 dfT=ab-1A因素因素自由度 dfA=a-1B因素因素自由度 dfB=b-1误差误差自由度 dfe=dfT - dfA-dfB=(a-1)(b-1) 相应均方均方为 MSA=SSA/dfA, MSB=SSB/dfB, MSe=SSe/dfe【例【例11.111.1】为了考察蒸馏水的pH 值和硫酸铜溶液浓度对化验血清中白蛋白与球蛋白的影响,将蒸馏水pH值(A因素)分成:A1
12、=5.40,A2 =5.60, A3=5.70,A4四个水平;将硫酸铜浓度(B因素)分成B1=0.04,B2=0.08,B3三个水平,进行交叉分组试验。即用同一血清在不同pH值和不同硫酸铜浓度配比下各测定一次,测定结果(白蛋白与球蛋白之比)如表11 3所示,试作方差分析。三两因素交叉资料的方差分析举例三两因素交叉资料的方差分析举例蒸馏水蒸馏水pH (A)硫酸铜浓度(B)合计合计xi.平均平均B1B2B3A13.52.32.07.82.6A22.62.01.96.52.2A32.01.51.24.71.6A41.40.80.32.50.8合计合计x .j9.56.65.421.5平均平均2.41
13、.71.4这是个两因素单独观察值试验结果。A因素有四个水平,即a=4;B因素有三个水平, 即b=3;共有ab=43=12个观察值。表表11-311-31.计算各项平方和与自由度计算各项平方和与自由度表表114 血清白、球蛋白测定结果方差分析表血清白、球蛋白测定结果方差分析表 根据df1=dfA=3, df2=dfe=6 查临界F F值,F0.01(3,6);根据df1=dfB=2, df2=dfe=6 查临界F值,F0.01(2,6)。 因为A因素(蒸馏水pH)的F F值F 1(3,6) ,故P,差异极显著;B因素(硫酸铜浓度)的F值F 1(2,6) ,P,差异极显著。2.列出方差分析表,进行
14、列出方差分析表,进行F 检验检验变异来源平方和自由度均 方F 值A因素5.2931.7640.93*B因素2.2221.1125.81 *误 差0.2660.043总变异7.7711(1)不同pH值下平均数间比较 在两因素单独观察值试验情况下,因为A因素(pH值)每一水平的重复数恰为B因素的水平数。故A因素的标准误 (2) 不同硫酸铜浓度下平均数间的比较 在两因素单独观察值试验情况下,B因素(硫酸铜浓度)每一水平的重复数恰为A因素的水平数,故B因素的标准误3.多重比较多重比较 (Duncan法法) 若两因素间有交互作用,则每个水平组合中只设一个试验单位(观察单位)的试验设计是不正确的或不完善的
15、。因为:因为: 在这种情况下,SSe、dfe 实际上是A、B两因素交互作用平方和与自由度,所算得的MSe 是交互作用均方,主要反映由交是交互作用均方,主要反映由交互作用引起的变异。互作用引起的变异。 若仍按【例11.1】所采用的方法进行方差分析,由于误差均方值大( 包含交互作用在内),有可能掩盖试验因素的显著性,从而增大犯增大犯型错误的概率。型错误的概率。 因为每个水平组合只有一个观察值,所以无法估计真正的无法估计真正的试验误差,试验误差, 因而不可能对因素的交互作用进行研究。 因此,进行两因素或多因素试验时,一般应设置重复,以便正确估计试验误差,深入研究因素间的交互作用交互作用。【例【例11
16、.211.2】 为了研究饲料中钙磷含量对幼猪生长发育的影响,将钙(A)、磷(B) 在饲料中的含量各分四个水平进行交叉分组试验。选用品种、性别、日龄相同,初始体重基本一致的幼猪48头,随机分成16组,每组3头,用能量、 蛋白质含量相同的饲料在不同钙磷用量搭配下各喂一组猪,经两月试验,幼猪增重结果(kg)列于表11-5。试分析钙磷对幼猪生长发育的影响。有重复有重复表115 不同钙磷用量的试验猪增重结果(kg)本例A因素钙的含量分4个水平,即a=4;B因素磷的含量分4个水平,即b=4;共有ab=44=16个水平组合;每个组合重复数n=3;共有163=48个观察值。 现对本例资料进行方差分析如下:1.
17、计算各项平方和与自由度计算各项平方和与自由度dfT=abn-1=4 43-1=47 dfA=a-1=4-1=3 dfB=b-1=4-1=3dfAB=(a-1)(b-1)=(4-1)(4-1)=9dfe=ab(n-1)=4 4 (3-1)=32表表116 不同钙磷用量方差分析表不同钙磷用量方差分析表 查临界F值:F0.05(3,32), F0.01(3,32), F0.01(9,32)。因为FAF0.05(3,32),FBF0.01(3,32) ;FABF0.01(9,32),表明钙、磷及其互作对幼猪的生长发育均有显著或极显著影响。 进一步进行钙各水平平均数间、磷各水平平均数间、钙与磷水平组合间
18、的多重比较和进行简单效应的检验。多重比较和进行简单效应的检验。变异来源变异来源平方和平方和自由度自由度均均 方方F 值值A因素因素44.51314.843.22 *B因素因素383.743127.9127.75 *互作(互作(AB)406.66945.189.80 *误误 差差147.41324.61总变异总变异982.32472.列出方差分析表,进行列出方差分析表,进行F 检验检验(1)钙含量(A)各水平平均数间的比较。不同钙含量平均数多重比较表见表11-7。 因为A因素各水平的重复数为bn,故A因素各水平的标准误(记为 )的计算公式为: 由dfe=32,秩次距k=2,3,4查附表9,得临界
19、r和r值,并与 相乘求得R值。列于下表。3.多重比较多重比较 (Duncan法法)表表117 117 r值与值与R值表值表表表11-8 11-8 不同钙含量平均数比较表不同钙含量平均数比较表dfe秩次距kq0.05q0.01LSR0.05LSR0.013222.883.881.792.4133.474.432.152.7543.834.782.372.96钙含量钙含量平均数 -26.6 -27.1 -27.7A2(0.8)29.22.6*2.11.5A3(0.6)27.71.10.6A1(1.0)27.10.5A4(0.4)26.6(2)磷含量(B)各水平平均数间的比较同理求得B因素各水平的标
20、准误:表表11-9 11-9 不同钙含量平均数比较表不同钙含量平均数比较表磷含量(磷含量(%) 平均数 -23.2 -27.3 -29.8B2(0.6)30.37.1 *3.0 *0.5B3(0.4)29.86.6 *2.5 *B1(0.8)27.34.1 *B4(0.2)23.2以上所进行的两项多重比较,实际上是A、B两两因素主效应的检验因素主效应的检验。结果表明,钙的含量以占饲料量的(A2)增重效果最好;磷的含量以占饲料量的(B2)增重效果最好。若若A、B因素交互作用不显著因素交互作用不显著,则可从主效应检验中分别选出A、B因素的最优水平相组合,得到最优水平组合; 若若A、B两因素交互作用
21、显著两因素交互作用显著,则应进行水平组合间的多重比较,以选出最优水平组合。( (一一) )平方根转换平方根转换 Square root transformation 此法适用于适用于各组方差与其平均数之间有某种比例关系的资料,尤其适用于总体呈普阿松分布的资料。 转换的方法转换的方法是求出原数据的平方根 。若原观察值中有为0的数或多数观察值小于10,则把原数据变换成 。 ( (二二) )对数转换对数转换 Logarithmic transformation 如果各组数据的标准差或全距与其平均数大体成比例,或者效应为相乘性而非相加性相乘性而非相加性,则将原数据变换为对数(lgx或lnx)后,可以使
22、方差变成比较稳定而且使效应由相乘性变成相加性。 如果原数据包括有0,可以采用lg(x+1)变换的方法。第二节数据转换第二节数据转换 Transformation of dataTransformation of data( (三三) )反正弦转换反正弦转换 Arcsine transformation 反正弦变换也称角度变换角度变换。此法适用于如发病率、感染率、病死率、受胎率等服从二项分布的资料。 转换的方法转换的方法是求出每个原数据(用百分数或小数表示)的反正弦:sin-1 。 应当注意的是,在对转换后的数据进行方差分应当注意的是,在对转换后的数据进行方差分析后,解释分析结果时,应还原为原来
23、的数值。析后,解释分析结果时,应还原为原来的数值。 以上介绍了三种数据转换的常用方法。对于一般非连续性的数据,最好在方差分析前先检查各处理平均数与相应处理内方差是否存在相关性和各处理方差间的变异性是否较大。如果存在相关性,或者变异性较大,则应考虑对数据作适当变换。 哪种方法能使处理平均数与其方差的相关性最小,哪种方法就是最合适的转换方法。多因素方差分析SST=SSA+SSB+SSC+SSAB+SSAC+SSBC+SSABC+SSeSSABC=SST-SSA-SSB-SSC-SSAB-SSAC-SSBC-SSe df : abcn-1a-1b-1c-1(a-1)(b-1)(a-1)(b-1)(b-1)(c-1)(a-1)(b-1)(c-1)abc(n-1)A、C为固定因素,B为随机因素,则FA=MSA/MSABFB=MSB/MSeFC=MSC/MSABFAB=MSAB/MSeFAC=MSAC/MSABCFBC=MSBC/MSeFABC=MSABC/MSe