方差分析基础课件

上传人:aa****6 文档编号:54730602 上传时间:2018-09-18 格式:PPT 页数:70 大小:533KB
返回 下载 相关 举报
方差分析基础课件_第1页
第1页 / 共70页
方差分析基础课件_第2页
第2页 / 共70页
方差分析基础课件_第3页
第3页 / 共70页
方差分析基础课件_第4页
第4页 / 共70页
方差分析基础课件_第5页
第5页 / 共70页
点击查看更多>>
资源描述

《方差分析基础课件》由会员分享,可在线阅读,更多相关《方差分析基础课件(70页珍藏版)》请在金锄头文库上搜索。

1、第七章 方差分析基础,7.1 方差分析的必要性与作用 7.2 方差分析及基本原理 7.3 多重比较 7.4 方差分析的数学模型 7.5 方差分析的基本假定与数据转换 7.6 方差分析的类型与分析步骤,7.1 方差分析的必要性与作用,一、方差分析的必要性,前面学习了两个样本平均数的假设测验,该法只适用于比较两个试验处理的优劣。用于多个平均数间差异显著性测验,就会表现出如下一些问题:,若进行5个样本平均数的差异显著性比较,则需进行10次两两均数差异显著性测验: H0: 1= 2 , 1= 3 , 1= 4 , 1= 5;2= 3 , 2= 4 , 2= 5;3= 4 , 3= 5;4= 5 .,1

2、多个处理用t测验计算麻烦,因此, 当样本平均数的个数k3时,采用上章学习的方法进行差异显著性测验,工作量是相当大的。,两个样本平均数比较采用t测验,=0.05时犯第一类错误的概率为0.05, 推断的可靠性为1- =0.95。若对5个处理采用t测验进行比较, =0.05, 需进行10次两两比较,每次比较的可靠性为1- =0.95 , 10次推断的可靠性由0.95降到0.5987, 犯第一类错误的概率则由0.05上升0.4013.,2.推断的可靠性降低,犯错误的概率增大,采用t测验法,每次只能利用两组观察值估计试验误差,与利用全部观察值估计的试验误差相比,精确性低,误差的自由度也低,从而使检验的灵

3、敏度也降低,容易掩盖差异的显著性,增大犯第二类错误的可能。,3.误差估计的精确性和检验的灵敏性降低,因此对多个处理平均数进行差异显著性测验,不宜采用t测验,而需采用方差分析法。,1、在单因素试验中,可以分辨出最优的水平。 2、在多因素试验中,可以分辨出最 优的水平组合。,二、方差分析的作用,解决多个处理的比较问题,充分利用资料的全部信息,提高分析的精确度。,方差分析的概念: 变异原因的数量分析 将试验数据的总变异分解为不同来源的变异,从而评定不同变异来源的相对重要性的一种统计方法。,7.2 方差分析及基本原理,设有k个处理,每个处理有n个观察值,则共有nk个观察值,其数据结构和符号如表7.1。

4、,一、数据结构与变异来源的分解,表7.1 K个处理n个观察值的符号表,每一个观察值的线性模型为:,处理间变异i=(i- ),处理内变异ij=( xij- i),由此可推知 : nk个观察值的总变异可分解为处理间的变异和处理内的变异两部分。,总体符号,表示全试验观测值总体的平均数,二、自由度与平方和的分解,1、总平方和分解由表7.1可以看出,nk个观察值的变异构成了整个资料的总变异,总变异的平方和即:,(7.1),记 为C(矫正数),SST分解,处理间平方和乃各处理的平均数的变异,即,处理内(误差)平方和乃各组的n个观察值与其相应平均数的离差平方和,即,2. 自由度的分解,1、总变异的自由度:d

5、fT=nk-1 2、处理间的自由度:dft=k-1 3、整个资料处理内(即误差项)自由度为:dfe=df1+df2+dfk=k(n-1),由上述分析可知,整个资料的变异来源可分为:处理间和处理内两个部分。因此,总平方和=处理间平方和+处理内平方和SST = SSt+ SSe,总自由度=处理间自由度+处理内自由度dfT = dft + dfe,于是, 处理间均方:处理内均方:总变异均方:,注意,表6.2 表6.1资料的方差分析,例6.1以A,B,C,D4种药剂处理水稻种子其中A为对照,处理各得4个苗高观察值(cm)其结果如表6.2,试进行方差分析。,表6.2 水稻不同处理苗高(cm),总和,平均

6、,第一步:统计假设H0:,第二步:整理资料,计算矫正数及各种平方和,第三步:列方差分析表并进行F测验,三、F分布与F测验,由前面的分析可知,表6.1中nk个观察值的大小不尽相同,它们之间的变异构成了整个数据的总变异,其总变异又可分为处理间变异和处理内变异。,1、F测验的基本原理,同一处理内的各个观察值不完全相同,各个处理内的随机变异之和就构成了整个资料的误差项变异。,处理内变异,当处理间真实差异=0时, 处理间变异=处理内变异,当处理间真实差异0时, 处理间变异处理内变异,因此:,处理间变异=处理间真实差异+处理内变异,利用这种关系,将处理间变异与处理内变异的比值定义为F值,,如果F与“1”相

7、差不多,表明各处理效应在本质上相同,即处理间差异不显著。如果F比“1”大得多,超出了通常偶然因素所能解释的范围,那就说明各处理效应有本质差异。,关于F值的大小,如何判断是否超过了用误差解释的范围?必须借助F测验。,F分布有一个平均数为 ,方差为 的正态总体,从中随机抽取两个样本,其容量分别为n1 和n2,则其自由度分别为df1 =n1-1和df2=n2-1,方差为 ,令两个方差之比为F,即,2、F分布与F测验,在给定的 样本容量n1 和n2下,从该总体进行一系列的抽样,则可获得一系列F值,各个F值所具有的概率构成一种分布,这一分布称为F分布。,F分布的平均数 F分布的取值范围为0,故F分布只有

8、一尾概率(即右尾概率),进行的F测验仅为一尾测验。,F分布是随自由度df1 和df2的改变而改变的一组偏态曲线,只有当df1和df2都趋向于时,F分布趋于对称分布。因此, F分布某一特定曲线的形状取决于参数df1和df2。,F分布下一定区间的概率可以从已制成的统计表(附表5)中查出。, F测验测验某项变异因素的效应是否真实存在。 若各处理的均数相等或者差异不显著,可以推断处理间不存在真实差异; 若各处理的均数不等且差异显著,可以推断处理间有真实差异。,第三步:列方差分析表并进行F测验,F测验结论:药剂间对苗高的效应差异达极显著。,*,第四步:多重比较,首先 计算比较标准(常用三种LSD法、SS

9、R法、q法),其次 进行均数间两两比较 列梯形表法 2、划线法 3、标记字母法,要明确各个处理平均数彼此间的差异显著性,还必须对各个平均数作相互比较,这种比较称为多重比较。常用的有以下几种:,7.3 多重比较,第一:计算平均数差数的标准误,其中, 为平均数的差数标准误;MSe为方差分析的误差项均方;n为样本容量(每一处理内观察值的个数);,具体方法如下:,一、最小显著差数法(LSD),实质是两个平均数相比较的t测验。,第三:将任意两个处理平均数的差与LSD相比较若,第二:计算出显著水平下的最小显著差数LSD,第四步:多重比较(LSD法),首先 计算比较标准,其次 进行均数间两两比较列梯形表法,

10、平均数 (,已算出LSD0.05=4.40LSD0.01=6.17,划线法,已算出LSD0.05=4.40LSD0.01=6.17,标记字母法,该试验除A与C处理无显著差异外,D与B及A、C处理间差异显著性达到,0.05水平。处理B与A、D与B、A与C无极,显著差异;D与A、C,B与C呈极显著差异。,已算出LSD0.05=4.40LSD0.01=6.17,根据dfe , P查SSR表,计算最小显著极差值LSR,不同平均数间的比较采用不同的显著尺度1、新复极差测验法(SSR法或Duncan法),二、最小显著极差法(LSR),计算平均数的标准误,P 为某两个极差间所包含的平均数个数,根据dfe ,

11、 P查 q 表,计算最小显著极差值LSR,计算平均数的标准误,P 为某两个极差间所包含的平均数个数,2、q 测验法(或Tukey测验),第三步:列方差分析表并进行F测验,F测验结论:药剂间对苗高的效应差异达极显著。,*,第四步:多重比较,首先 计算比较标准(常用三种LSD法、SSR法、q法),其次 进行均数间两两比较 列梯形表法 2、划线法 3、标记字母法,上例:,表6.2资料LSR值的计算(复新极差测验或SSR法),表6.2资料,值的计算(q测验),1.列梯形表法,平均数 (,其次 进行均数间两两比较,查LSRa,划线法,查LSRa,标记字母法,该试验除A与C处理无显著差异外,D与B及A、C

12、处理间差异显著性达到,0.05水平。处理B与A、D与B、A与C无极,显著差异;D与A、C,B与C呈极显著差异。,查LSRa,第四步 多重比较(q法或Tukey测验),LSD或SSR,犯错误的风险较大;犯错误的风险小,犯错误的风险较大;犯错误的风险小,q测验,三、多重比较方法的选择,表6.2资料LSR值的计算(复新极差测验),表6.2资料LSR值的计算(q法),SSR法与q法比较,在农业和生物学上,由于试验工作者通常都寄希望于否定H0,所以LSD和SSR得到较为广泛的应用。如果试验是几个处理都与一个对照相比,则可选用LSD法;如果试验是每两个处理都要进行相互比较,则宜选用SSR法。,1、方差分析

13、的数学模型,指试验资料的数据结构,或者说指每一观察值的线性组成部分。,一、方差分析的数学模型与期望均方,&7.4 方差分析的数学模型,进行方差分析的基础; 自由度与平方和分解的依据。,数学模型:,设在一平均数为 、方差为2 的正态总体中随机抽取容量为n的一组样本。由于随机误差,每一个xi都和总体平均数有差别,这个差量就是随机误差i。,表7.1 K个处理n个观察值的符号表,其中,iN(0,2), 故,因而每一个观察值都具有线性可加模型:,任一观察值xij所具有的线性模型为:,式中:i=(i- ),并满足 i=0;ij=(xij-i)是相互独立,并具有分布N(0,2)。,i=1,2,k; j=1,

14、2,n,2、方差分析的期望均方 若A是B的无偏估计,则称B是A的数学期望。 数理统计已经证明,MSe(样本的误差均方)是样本所在总体的误差方差2的无偏估计值。于是,MSe的数学期望为2。因为2 为均方的数学期望,故又称期望均方。, MSt的期望均方不是t2,因为它是由处理平均数计算得到的,它由两个可能的部分构成:a.平均数的抽样方差 b.处理平均数本身差异的方差,即处理方差t2,又因每个处理的平均数由n个数据得到, 故有: 为MSt的数学期望,或处理效应的期望均方。,当t2 =0时,F=1,表示处理间无差异; 当F值很大时,表明t2 0即处理间存在差异。,因为,EMS作用:是正确进行F测验的基

15、础,二、固定模型与随机模型对于处理效应,由于试验目的的不同而有不同的解释,从而产生了方差分析的两种数学模型: 固定模型和随机模型,指试验的各个处理都抽自特定的处理总体,因而处理效应是固定的,我们的目的就是研究各个处理效应,所作的推断也仅限于供试处理的范围之内。,固定模型:,一般的栽培试验,如肥料试验、农药试验、密度试验、品比试验等都属于固定模型。,特点,a.抽样方式是固定有标准的;,b.试验的目的是估计个别处理的效应,c.H0:i=0或= = = = 对HA: i0,d.推断仅限于供试处理范围内,e. F测验后,要进行均数的多重比较,指试验中的各个处理皆抽自同一总体的一组随机样本,因而处理效应是随机的,我们的目的不在于研究供试处理本身的效应,而在于研究处理效应的变异度,所以我们的推断也不是关于某些供试处理,而是关于抽出这些处理的整个总体。,随机模型:,随机模型在遗传、育种和生态试验方面,有较广泛的应用。,特点:,a.抽样方式是随机的,没有固定的标准;,b.试验的目的是估计样本所在总体的变异;,c.,d.推断关于样本所在总体的变异;,e.F测验后,不进行均数的多重比较,而需估计方差;,形式的区别:,固定效应用 表示,随机效应用 表示,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号