《第三章常用试验设计1完全随机系统分组高等教学》由会员分享,可在线阅读,更多相关《第三章常用试验设计1完全随机系统分组高等教学(86页珍藏版)》请在金锄头文库上搜索。
1、第三章第三章 常用试验设计的方差分析常用试验设计的方差分析(Analysis of Variance ) ANOVA多个均数的比较多个均数的比较1高级教育方差分析由英国统计学方差分析由英国统计学家家R.A.FisherR.A.Fisher于于19231923年年首创,为纪念首创,为纪念FisherFisher,以以F F命名,故方差分析命名,故方差分析又称又称 F F 检验检验 (F F testtest)。用于推断)。用于推断多个多个总体均数总体均数有无差异有无差异 2高级教育1、数据结构、数据结构 设有设有k 个组,每组的观察值数据是来自该组的处理所代个组,每组的观察值数据是来自该组的处理
2、所代表的总体的一个样本。表的总体的一个样本。全部数据的结构如下:全部数据的结构如下:方差分析的数学模型与基本假定方差分析的数学模型与基本假定3高级教育ai : 第第i 个处理的总体平均数(第个处理的总体平均数(第i组所来自总体的总体平组所来自总体的总体平 均数)均数)eij : 随机误差随机误差三个基本假定:三个基本假定:单因素试验观察值的线性模型(linear modellinear model) 4高级教育5高级教育组内离均差平方和,简称组内离均差平方和,简称组内平方和组内平方和:度量了组内的变异。由于组内变异与处理无度量了组内的变异。由于组内变异与处理无关,是由于个体间的随机误差造成的,
3、所以关,是由于个体间的随机误差造成的,所以又称为又称为误差平方和误差平方和。组间离均差平方和,简称组间离均差平方和,简称组间平方和组间平方和:度量了组间的变异。由于组间的差异除了随度量了组间的变异。由于组间的差异除了随机误差以外,还包括不同处理造成的差异,机误差以外,还包括不同处理造成的差异,所以又称为处理平方和。所以又称为处理平方和。平方和与自由度的剖分平方和与自由度的剖分6高级教育平方和的计算平方和的计算7高级教育 总自由度的剖分总自由度的剖分 (i=1,2,k) 平方和与自由度的剖分 8高级教育期望均方期望均方均方:均方:将组内平方和和组间平方和分别除以它们相应的自将组内平方和和组间平方
4、和分别除以它们相应的自 由度,得到的统计量分别称为由度,得到的统计量分别称为组内均方组内均方(误差均方误差均方) 和和组间均方组间均方(处理均方处理均方)。)。不称方差,而称为均方不称方差,而称为均方9高级教育期望均方期望均方显然,各Si2的合并方差Se2 (以各处理内的自由度n-1为权的加权平均数)也是2的无偏估计量,且估计的精确度更高。很容易推证处理内均方MSe就是各Si2的合并。10高级教育期望均方期望均方效应方差 它也反映了各处理观测值总体平均数的变异程度,记为2试验中各处理所属总体的本质差异体现在处理效应i的差异上。 11高级教育期望均方期望均方 这是因为处理观测值的均数间的差异实际
5、上包含了两方面的内容:一是各处理本质上的差异即i(或i)间的差异,二是本身的抽样误差。非2的无偏估计量是2 +2/n的无偏估计量MSt12高级教育误差方差误差方差处理效应处理效应期望均方,简记为EMSEMS(expected mean squaresexpected mean squares): :13高级教育期望均方期望均方 当处理效应的方差2 =0,亦即各处理观测值总体平均数i(i=1,2,,k)相等时,处理间均方MSt与处理内均方一样,也是误差方差2的估计值,方差分析就是通过MSt 与MSe的比较来推断2是否为零即i是否相等的。 14高级教育检验各组所代表的总体的平均数,即各个检验各组所
6、代表的总体的平均数,即各个 i之之间是否存在差异间是否存在差异(1)假设)假设H H0 0: : 1 1 = = 2 2 = = = = k k 或或 a a1 1 = = a a2 2 = = = = a ak k = 0= 0H HA A: : 至少有两个均数不等至少有两个均数不等 或或 至少有一个至少有一个 a a 0 0F分布与F检验15高级教育 (2)检验统计量)检验统计量MSA: 组间均方,组间均方, MSE:组内均方组内均方当当 H0 成立时,成立时,当当 H0 不成立时,不成立时,当当H0不成立时,值只应该落在分布的一侧,不成立时,值只应该落在分布的一侧,即右侧。所以为单侧检验
7、即右侧。所以为单侧检验16高级教育 ()统计推断()统计推断显著或极显著:至少有两显著或极显著:至少有两个平均数间存在差异个平均数间存在差异选取显著性水平选取显著性水平 (0.05或或0.01)查表找到查表找到F (dfA,dfE)的值的值比较计算的比较计算的 F 值与查表的值与查表的F (dfA,dfE)值值17高级教育方差分析表方差分析表18高级教育各处理重复数相等的方差分析 抽测5个不同品种的若干头母猪的窝产仔数,结果见表6-12,试检验不同品种母猪平均窝产仔数的差异是否显著。表6-12 五个不同品种母猪的窝产仔数19高级教育解:20高级教育 根据df1=dft=4,df2=dfe=20
8、查临界F值得:F0.05(4,20) =2.87,F0.05(4,20) =4.43,因为FF0.01(4,20),即P0.01,表明品种间产仔数的差异达到1%显著水平。 21高级教育多重比较(multiple comparison)方法 统计上把多个平均数两两间的相互比较称为多重比较(multiple comparisons)(multiple comparisons) 多重比较的方法甚多,常用的有最小显著差数法(LSD法)和最小显著极差法(LSR法) 22高级教育三种多重比较方法,其检验尺度有如下关系:LSD法新复极差法q检验法秩次距k=2时,取等号;秩次距k3时,取小于号。 在多重比较中
9、, LSD法的尺度最小, q检验法尺度最大,新复极差法尺度居中。用上述排列顺序前面方法检验显著的差数,用后面方法检验未必显著;用后面方法检验显著的差数,用前面方法检验必然显著 。多重比较多重比较23高级教育标记字母法与多重直线法 24高级教育标记字母法 (Any Questions?)Table 3 mean of fibre for the different genotypes of KAP8.2 geneMean within a column with no common superscript alphabet differed significantly (P 0.01).25高级
10、教育其他表示方法26高级教育SPSS软件分析:软件分析:弹出One-Way ANOVA 对话框从对话框左侧的变量列表中选“W” 使之进入 Dependent List “因变量框”框从对话框左侧的变量列表中选“B” 使之进入Factor (因素)框。SPSSAnalyzeCompare meansOne-way ANOVA27高级教育28高级教育29高级教育30高级教育方差分析的两种模型 31高级教育(2)随机模型)随机模型32高级教育33高级教育单因素完全随机设计(Completely Randomized Design with Single Factor ) 完全随机设计是将所有试验单元
11、完全随机地分配到各个处理中,使得每个试验单元都有相同的机会接受某个处理,而不受试验人员主观倾向的影响其实质是将供试材料随机分组 34高级教育完全随机设计的主要优点 完全随机设计简单、容易,处理数与重复数都不受限制,适用于试验条件、环境、试验材料差异较小的试验;统计分析简单,无论所获得的试验资料各处理重复数相同与否,都可用t检验或方差分析法进行统计分析;试验误差自由度大于处理数和重复数相等的其他设计 。 主要缺点:在试验条件、环境、试验材料差异较大时,不宜采用此种设计方法35高级教育36高级教育37高级教育38高级教育39高级教育单因素系统分组设计试验的方差分析单因素系统分组设计试验的方差分析是
12、把试验空间逐级向低次级方向划分的试验设计方法,亦称为巢式设计对于单因素试验来讲,试验因素A的参试处理为共a个,先把试验空间分为a个组,每组随机安排一个处理,再把组分为m个亚组,在每个亚组中设置r个试验单元,供随机重复之用,这样的设计称为单因素二级系统分组设计 40高级教育【例3-2-5】在温室中用四种培养液A1,A2,A3和A4培养某作物,每种培养液3盆,每盆4株一个月后测定其株高生长量(mm),其结果如表3-2-11所示41高级教育42高级教育43高级教育44高级教育45高级教育46高级教育47高级教育次级样本不等的试验分析起来很麻烦且精度不高,因而是不提倡的 48高级教育49两因素方差分析
13、:试验指标同时受两个因素作用,两因素方差分析:试验指标同时受两个因素作用, 分为分为交叉分组资料和系统分组资料交叉分组资料和系统分组资料两类。两类。两因素完全随机试验的两因素完全随机试验的方差分析方差分析无重复观察值的交叉分组资料无重复观察值的交叉分组资料 A因素:因素:Ai,i=1、2a B因素:因素:Bj,j=1、2b 因素因素A的每个水平与因素的每个水平与因素B的每个水平都彼此交叉,产生的每个水平都彼此交叉,产生组合;在每个水平组合只有一个观测值(无重复),共有组合;在每个水平组合只有一个观测值(无重复),共有ab个观测值。个观测值。49高级教育50无重复观察值资料模式:无重复观察值资料
14、模式:A A B B1 1 B B2 2 B Bb bA A的总和的总和 A A的平均的平均A A1 1A A2 2A Aa a x x1111 x x1212 x x1b1b x x2121 x x2222 x x2b2b x xa1a1 x xa2a2 x xabab X X1 1. .X X2 2. .X Xa a. . B B的总和的总和 x.x.1 1 x. x.2 2 x. x.b b x.x.B B的平均的平均 各个字母的含义各个字母的含义50高级教育51资料模式:资料模式:51高级教育52 总平方和总平方和 =A=A因素平方和因素平方和+B+B因素平方和因素平方和+ +误差平方
15、和误差平方和 52高级教育53自由度的剖分自由度的剖分53高级教育两因素完全随机有重复资料的方差分析两因素完全随机有重复资料的方差分析54高级教育55资料模式:资料模式: B B的平均的平均x.x. x.x.1 1. . x. x.b b. . B B的总和的总和X X1 1.X Xa a. . A A1 1A Aa aA A的平均的平均A A的总和的总和 B B1 1 B Bb bA Ax x111111,x,x112112x x11n11n x x1111. .x x1b11b1,x,x1b21b2x x1bn1bn x x1b1b. .x xa11a11,x,xa12a12x xa1na
16、1n x xa1a1. .x xab1ab1,x,xab2ab2x xabnabn x xabab. .在因素在因素A和因素和因素B的每个水平组合中的每个水平组合中都有都有n个观测值。个观测值。55高级教育在进行双向分类资料的方差分析时,除了要注意在进行双向分类资料的方差分析时,除了要注意分析每个处理因素的作用以外,还要注意分析它分析每个处理因素的作用以外,还要注意分析它们之间的们之间的交互作用交互作用。有重复和无重复资料方差分析的主要区别:有重复和无重复资料方差分析的主要区别:利用有重复发资料可以分析两因素各水平之间的利用有重复发资料可以分析两因素各水平之间的交互作用。交互作用。 交互作用交
17、互作用定义:简称互作,指两个或两个以上因素之间相定义:简称互作,指两个或两个以上因素之间相 互作用效应的简称,也称交互作用。互作用效应的简称,也称交互作用。56高级教育570AB日日增增重重品种甲品种甲品种乙品种乙饲料饲料无互作无互作0AB日日增增重重品种甲品种甲品种乙品种乙饲料饲料有互作有互作57高级教育58 数学模型数学模型58高级教育59 平方和与自由度的剖分:平方和与自由度的剖分:(1)先将离均差平方和剖分为:)先将离均差平方和剖分为:(2)再将两边求和:)再将两边求和:0SST:总平方和总平方和SSE:误差平方和:误差平方和SStSSSSt t:处理平方和,反映了:处理平方和,反映了
18、A A因素和因素和B B因素以及它们因素以及它们之间的互作对观测值的总的影响。之间的互作对观测值的总的影响。59高级教育60(3)将处理平方和做进一步剖分:)将处理平方和做进一步剖分:0(4)两边求和:)两边求和:SSASSABSSBSSt60高级教育61 总平方和总平方和 =A=A因素平方和因素平方和+B+B因素平方和因素平方和 + +互作平方和互作平方和+ +误差平方和误差平方和 61高级教育62平方和的计算公式平方和的计算公式2.总平方和总平方和3.A因素平方和因素平方和1. 矫正项矫正项62高级教育634.B因素平方和因素平方和5.处理平方和处理平方和63高级教育646.互作平方和互作
19、平方和7.误差平方和误差平方和64高级教育65高级教育66例例6.66.6】为了研究饲料中钙磷含量对幼猪生长发育的影响,将钙(A)、磷(B)在饲料中的含量各分4个水平进行交叉分组试验。先用品种、性别、日龄相同,初始体重基本一致的幼猪48头,随机分成16组,每组3头,用能量、蛋白质含量相同的饲料在不同钙磷用量搭配下各喂一组猪,经两月试验,幼猪增重结果(kg)列于表6-29,试分析钙磷对幼猪生长发育的影响。66高级教育67表6-29 不同钙磷用量(%)的试验猪增重结果(kg)67高级教育681、计算各项平方和与自由度68高级教育6969高级教育70表6-30 不同钙磷用量方差分析表2、列出方差分析
20、表,进行F检验 查临界F值:F0.05(3,32)=2.90,F0.01(3,32)=4.47,F0.01(9,32)=3.02。因为,FAF0.05(3,32);FBF0.01(3,32);FABF0.01(9,32),表明钙、磷及其互作对幼猪的生长发育均有显著或极显著影响。因此,应进一步进行钙各水平平均数间、磷各水平平均数间、钙与磷水平组合平均数间的多重比较和进行简单效应的检验。70高级教育713、多重比较(1)钙含量(A)各水平平均数间的比较 不同钙含量平均数多重比较表见表6-31。表6-31 不同钙含量平均数比较表(q法)表6-32 q值与LSR值表71高级教育72表6-33 不同磷含
21、量平均数比较表(q法)(2)磷含量(B)各水平平均数间的比较 不同磷含量平均数多重比较表见表6-33。表6-32 q值与LSR值表72高级教育73(3)各水平组合平均数间的比较 因为水平组合数通常较大(本例ab=44=16),采用最小显著极差法进行各水平组合平均数的比较,计算较麻烦。为了简便起见,常采用T检验法。所谓T检验法,实际上就是以q检测法中秩次距k最大时的LSR值作为检验尺度检验各水平组合平均数间的差异显著性。此例 73高级教育7474高级教育75(4)简单效应的检验 简单效应实际上是特定水平组合平均数间的差数。检验尺度仍为(3)中的LSR0.05=6.51,LSR0.01=7.65。
22、75高级教育76A1水平(1.0)A2水平(0.8)76高级教育77A4水平(0.4)A3水平(0.6)77高级教育78B因素各水平上A因素各水平平均数间的比较B2水平(0.6)B1水平(0.8)78高级教育79B4水平(0.2)B3水平(0.4)79高级教育SPSS软件分析步骤:SPSSANALYZEGeneral Linear ModelUnivariateAnalyzeGeneral linear model(一般线性模型)(一般线性模型)Univariate(单变量)(单变量)弹出Univariate对话框从对话框左侧的变量列表中选“W” 使之进入 Dependent List框从对话框左侧的变量列表中选“Ca” 和“P”使之进入Fixed Factor(固定因素)框。80高级教育81高级教育82高级教育83高级教育84高级教育85高级教育86高级教育