方差分析基础课件－金锄头文库

资源描述

《方差分析基础课件》由会员分享，可在线阅读，更多相关《方差分析基础课件（70页珍藏版）》请在金锄头文库上搜索。

1、第七章方差分析基础,7.1 方差分析的必要性与作用 7.2 方差分析及基本原理 7.3 多重比较 7.4 方差分析的数学模型 7.5 方差分析的基本假定与数据转换 7.6 方差分析的类型与分析步骤,7.1 方差分析的必要性与作用,一、方差分析的必要性,前面学习了两个样本平均数的假设测验，该法只适用于比较两个试验处理的优劣。用于多个平均数间差异显著性测验，就会表现出如下一些问题：,若进行5个样本平均数的差异显著性比较，则需进行10次两两均数差异显著性测验: H0: 1= 2 , 1= 3 , 1= 4 , 1= 5；2= 3 , 2= 4 , 2= 5；3= 4 , 3= 5；4= 5 .,1

2、多个处理用t测验计算麻烦,因此, 当样本平均数的个数k3时，采用上章学习的方法进行差异显著性测验，工作量是相当大的。,两个样本平均数比较采用t测验，=0.05时犯第一类错误的概率为0.05, 推断的可靠性为1- =0.95。若对5个处理采用t测验进行比较， =0.05, 需进行10次两两比较，每次比较的可靠性为1- =0.95 , 10次推断的可靠性由0.95降到0.5987, 犯第一类错误的概率则由0.05上升0.4013.,2.推断的可靠性降低，犯错误的概率增大,采用t测验法，每次只能利用两组观察值估计试验误差，与利用全部观察值估计的试验误差相比，精确性低，误差的自由度也低，从而使检验的灵

3、敏度也降低，容易掩盖差异的显著性，增大犯第二类错误的可能。,3.误差估计的精确性和检验的灵敏性降低,因此对多个处理平均数进行差异显著性测验，不宜采用t测验，而需采用方差分析法。,1、在单因素试验中，可以分辨出最优的水平。 2、在多因素试验中，可以分辨出最优的水平组合。,二、方差分析的作用,解决多个处理的比较问题，充分利用资料的全部信息，提高分析的精确度。,方差分析的概念：变异原因的数量分析将试验数据的总变异分解为不同来源的变异，从而评定不同变异来源的相对重要性的一种统计方法。,7.2 方差分析及基本原理,设有k个处理，每个处理有n个观察值，则共有nk个观察值，其数据结构和符号如表7.1。

4、,一、数据结构与变异来源的分解,表7.1 K个处理n个观察值的符号表,每一个观察值的线性模型为：,处理间变异i=(i- ),处理内变异ij=( xij- i),由此可推知 : nk个观察值的总变异可分解为处理间的变异和处理内的变异两部分。,总体符号,表示全试验观测值总体的平均数,二、自由度与平方和的分解,1、总平方和分解由表7.1可以看出，nk个观察值的变异构成了整个资料的总变异，总变异的平方和即：,(7.1）,记为C(矫正数),SST分解,处理间平方和乃各处理的平均数的变异，即,处理内（误差）平方和乃各组的n个观察值与其相应平均数的离差平方和，即,2. 自由度的分解,1、总变异的自由度：d

5、fT=nk-1 2、处理间的自由度：dft=k-1 3、整个资料处理内（即误差项）自由度为：dfe=df1+df2+dfk=k(n-1),由上述分析可知，整个资料的变异来源可分为：处理间和处理内两个部分。因此，总平方和=处理间平方和+处理内平方和SST = SSt+ SSe,总自由度=处理间自由度+处理内自由度dfT = dft + dfe,于是，处理间均方：处理内均方：总变异均方：,注意,表6.2 表6.1资料的方差分析,例6.1以A，B，C，D4种药剂处理水稻种子其中A为对照，处理各得4个苗高观察值（cm）其结果如表6.2，试进行方差分析。,表6.2 水稻不同处理苗高（cm）,总和,平均

6、,第一步：统计假设H0：,第二步：整理资料，计算矫正数及各种平方和,第三步：列方差分析表并进行F测验,三、F分布与F测验,由前面的分析可知，表6.1中nk个观察值的大小不尽相同，它们之间的变异构成了整个数据的总变异，其总变异又可分为处理间变异和处理内变异。,1、F测验的基本原理,同一处理内的各个观察值不完全相同，各个处理内的随机变异之和就构成了整个资料的误差项变异。,处理内变异,当处理间真实差异=0时，处理间变异=处理内变异,当处理间真实差异0时，处理间变异处理内变异,因此:,处理间变异=处理间真实差异+处理内变异,利用这种关系，将处理间变异与处理内变异的比值定义为F值，,如果F与“1”相

7、差不多，表明各处理效应在本质上相同，即处理间差异不显著。如果F比“1”大得多，超出了通常偶然因素所能解释的范围，那就说明各处理效应有本质差异。,关于F值的大小，如何判断是否超过了用误差解释的范围？必须借助F测验。,F分布有一个平均数为，方差为的正态总体，从中随机抽取两个样本，其容量分别为n1 和n2，则其自由度分别为df1 =n1-1和df2=n2-1，方差为，令两个方差之比为F，即,2、F分布与F测验,在给定的样本容量n1 和n2下，从该总体进行一系列的抽样，则可获得一系列F值，各个F值所具有的概率构成一种分布，这一分布称为F分布。,F分布的平均数 F分布的取值范围为0，故F分布只有

8、一尾概率（即右尾概率），进行的F测验仅为一尾测验。,F分布是随自由度df1 和df2的改变而改变的一组偏态曲线，只有当df1和df2都趋向于时，F分布趋于对称分布。因此， F分布某一特定曲线的形状取决于参数df1和df2。,F分布下一定区间的概率可以从已制成的统计表（附表5）中查出。, F测验测验某项变异因素的效应是否真实存在。若各处理的均数相等或者差异不显著，可以推断处理间不存在真实差异；若各处理的均数不等且差异显著，可以推断处理间有真实差异。,第三步：列方差分析表并进行F测验,F测验结论：药剂间对苗高的效应差异达极显著。,*,第四步：多重比较,首先计算比较标准(常用三种LSD法、SS

9、R法、q法）,其次进行均数间两两比较列梯形表法 2、划线法 3、标记字母法,要明确各个处理平均数彼此间的差异显著性，还必须对各个平均数作相互比较，这种比较称为多重比较。常用的有以下几种：,7.3 多重比较,第一：计算平均数差数的标准误,其中，为平均数的差数标准误；MSe为方差分析的误差项均方；n为样本容量（每一处理内观察值的个数）；,具体方法如下：,一、最小显著差数法（LSD）,实质是两个平均数相比较的t测验。,第三：将任意两个处理平均数的差与LSD相比较若,第二：计算出显著水平下的最小显著差数LSD,第四步：多重比较（LSD法）,首先计算比较标准,其次进行均数间两两比较列梯形表法,

10、平均数（,已算出LSD0.05=4.40LSD0.01=6.17,划线法,已算出LSD0.05=4.40LSD0.01=6.17,标记字母法,该试验除A与C处理无显著差异外，D与B及A、C处理间差异显著性达到,0.05水平。处理B与A、D与B、A与C无极,显著差异；D与A、C，B与C呈极显著差异。,已算出LSD0.05=4.40LSD0.01=6.17,根据dfe , P查SSR表，计算最小显著极差值LSR,不同平均数间的比较采用不同的显著尺度1、新复极差测验法（SSR法或Duncan法）,二、最小显著极差法（LSR）,计算平均数的标准误,P 为某两个极差间所包含的平均数个数,根据dfe ,

11、 P查 q 表，计算最小显著极差值LSR,计算平均数的标准误,P 为某两个极差间所包含的平均数个数,2、q 测验法（或Tukey测验）,第三步：列方差分析表并进行F测验,F测验结论：药剂间对苗高的效应差异达极显著。,*,第四步：多重比较,首先计算比较标准(常用三种LSD法、SSR法、q法）,其次进行均数间两两比较列梯形表法 2、划线法 3、标记字母法,上例：,表6.2资料LSR值的计算（复新极差测验或SSR法）,表6.2资料,值的计算（q测验）,1.列梯形表法,平均数（,其次进行均数间两两比较,查LSRa,划线法,查LSRa,标记字母法,该试验除A与C处理无显著差异外，D与B及A、C

12、处理间差异显著性达到,0.05水平。处理B与A、D与B、A与C无极,显著差异；D与A、C，B与C呈极显著差异。,查LSRa,第四步多重比较（q法或Tukey测验),LSD或SSR,犯错误的风险较大；犯错误的风险小,犯错误的风险较大；犯错误的风险小,q测验,三、多重比较方法的选择,表6.2资料LSR值的计算（复新极差测验）,表6.2资料LSR值的计算（q法）,SSR法与q法比较,在农业和生物学上，由于试验工作者通常都寄希望于否定H0，所以LSD和SSR得到较为广泛的应用。如果试验是几个处理都与一个对照相比，则可选用LSD法；如果试验是每两个处理都要进行相互比较，则宜选用SSR法。,1、方差分析

13、的数学模型,指试验资料的数据结构，或者说指每一观察值的线性组成部分。,一、方差分析的数学模型与期望均方,&7.4 方差分析的数学模型,进行方差分析的基础；自由度与平方和分解的依据。,数学模型：,设在一平均数为、方差为2 的正态总体中随机抽取容量为n的一组样本。由于随机误差，每一个xi都和总体平均数有差别，这个差量就是随机误差i。,表7.1 K个处理n个观察值的符号表,其中，iN（0，2），故,因而每一个观察值都具有线性可加模型：,任一观察值xij所具有的线性模型为：,式中：i=(i- )，并满足 i=0；ij=(xij-i)是相互独立,并具有分布N（0,2）。,i=1,2,k; j=1,

14、2,n,2、方差分析的期望均方若A是B的无偏估计，则称B是A的数学期望。数理统计已经证明，MSe（样本的误差均方）是样本所在总体的误差方差2的无偏估计值。于是，MSe的数学期望为2。因为2 为均方的数学期望，故又称期望均方。, MSt的期望均方不是t2，因为它是由处理平均数计算得到的，它由两个可能的部分构成：a.平均数的抽样方差 b.处理平均数本身差异的方差，即处理方差t2,又因每个处理的平均数由n个数据得到，故有：为MSt的数学期望，或处理效应的期望均方。,当t2 =0时，F=1,表示处理间无差异；当F值很大时，表明t2 0即处理间存在差异。,因为,EMS作用：是正确进行F测验的基

15、础,二、固定模型与随机模型对于处理效应，由于试验目的的不同而有不同的解释，从而产生了方差分析的两种数学模型：固定模型和随机模型,指试验的各个处理都抽自特定的处理总体，因而处理效应是固定的，我们的目的就是研究各个处理效应，所作的推断也仅限于供试处理的范围之内。,固定模型：,一般的栽培试验，如肥料试验、农药试验、密度试验、品比试验等都属于固定模型。,特点,a.抽样方式是固定有标准的；,b.试验的目的是估计个别处理的效应,c.H0:i=0或= = = = 对HA: i0,d.推断仅限于供试处理范围内,e. F测验后，要进行均数的多重比较,指试验中的各个处理皆抽自同一总体的一组随机样本，因而处理效应是随机的，我们的目的不在于研究供试处理本身的效应，而在于研究处理效应的变异度，所以我们的推断也不是关于某些供试处理，而是关于抽出这些处理的整个总体。,随机模型：,随机模型在遗传、育种和生态试验方面，有较广泛的应用。,特点：,a.抽样方式是随机的，没有固定的标准；,b.试验的目的是估计样本所在总体的变异;,c.,d.推断关于样本所在总体的变异;,e.F测验后,不进行均数的多重比较,而需估计方差;,形式的区别：,固定效应用表示,随机效应用表示,

展开阅读全文