生物统计附试验设计第六章方差分析(2017)

上传人:go****e 文档编号:137256178 上传时间:2020-07-06 格式:PPT 页数:123 大小:2.66MB
返回 下载 相关 举报
生物统计附试验设计第六章方差分析(2017)_第1页
第1页 / 共123页
生物统计附试验设计第六章方差分析(2017)_第2页
第2页 / 共123页
生物统计附试验设计第六章方差分析(2017)_第3页
第3页 / 共123页
生物统计附试验设计第六章方差分析(2017)_第4页
第4页 / 共123页
生物统计附试验设计第六章方差分析(2017)_第5页
第5页 / 共123页
点击查看更多>>
资源描述

《生物统计附试验设计第六章方差分析(2017)》由会员分享,可在线阅读,更多相关《生物统计附试验设计第六章方差分析(2017)(123页珍藏版)》请在金锄头文库上搜索。

1、第六章 方差分析(ANOVA),前面所介绍的t 检验法适用于样本均数与总体均数及两样本均数间的均数差异显著性检验。 但经常会遇到比较多个处理优劣的问题,即需进行多个平均数间的差异显著性检验。这时,若仍采用t 检验法就不适宜了。这是因为:,计算量大,检验过程烦琐; 无统一的试验误差,误差估计的精确性、检验的灵敏性降低; 推断的可靠性低,检验的型错误率大。 因此,多个均数的差异显著性检验不宜用t检验,须采用本章所介绍的方差分析法。,方差分析法是将多个处理的观测值作为一个整体看待,把观察值总变异的平方和及自由度分解为相应于不同变异来源的平方和及自由度,进而获得不同变异来源的总体方差估计值;通过计算这

2、些估计值的适当比值,就能检验各样本所属总体均值是否相等。 方差分析实质上是关于观测值变异原因的数量分析。,几个常用术语 1、试验指标(experimental index) 为衡量试验结果的好坏或处理效应的高低,在试验中具体测定的性状或观测的项目。 如:身高、体重、发芽率、产量等,2、试验因素(experimental factor) 试验中所研究的影响试验指标的因素 单因素试验(当试验中考察的因素只有一个) 两因素或多因素试验 同时研究两个或两个以上的因素对试验指标的影响。试验因素常用大写字母A、B、C、等表示。,3、因素水平(level of factor) 试验因素所处的某种特定状态或数

3、量等级称为因素水平,简称水平。 因素水平用代表该因素的字母加足标1,2,来表示(如A1、A2等)。 如:处理时间、剂量等,4、试验处理(treatment) 事先设计好的实施在试验单位上的具体项目叫试验处理,简称处理。 进行单因素试验时,试验因素的一个水平就是一个处理。 在多因素试验时,试验因素的一个水平组合就是一个处理。,5、试验单位(experimental unit) 在试验中能接受不同试验处理的独立的试验载体 6、重复(repetition) 在试验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复;一处理实施的试验单位数称为处理的重复数。,本章主要内容,第一节 方差分析的

4、基本原理 第二节 单因素试验资料的方差分析 第三节 两因素试验资料的方差分析 第四节 数据转换,第一节 方差分析的基本原理,一、线性模型与基本假定 二、平方和与自由度的剖分 三、 F分布与F检验 四、多重比较 五、方差分析的基本步骤,本节结合单因素试验的方差分析介绍其原理与步骤。 一、线性模型与基本假定 假设某单因素试验有k个处理,每个处理有n次重复,共有nk个观测值。这类试验资料的数据模式如表6-1所示。,第一节 方差分析的基本原理,表6-1 k个处理每个处理有n个观察值的数据模式,注意:在本章我们采用了黑点符号体系法,黑点表示对该位置的脚标求和。 表示第i个处理n个观测值的和; 表示全部观

5、测值的总和; 表示第i个处理的平均数; 表示全部观测值的总平均数;,ai 是 第 i 个 处理的效应 ,表示处理i对试验结果产生的影响; ij 是试验误差,相互独立,且服从 正态分布N(0,2),单因素试验 的 线 性 模 型(数学模型),在这个模型中xij表示为总平均数、处理效应i、试验误差ij 之和。,单因素试验的数学模型可归纳为: 效 应 的 可加性(additivity)、分布的正态性(normality)、方差的同质性(homogeneity)。 这也是进行其它类型方差分析的前提或基本假定。,若 将 表(6-1) 中 的 观 测 值 xij(i=1,2,k;j=1,2,n)的数据结构

6、用样本符号来表示,则,的估计值,i的估计值,ij的估计值,故kn个观测值的总变异可分解为处理间的变异和处理内的变异两部分,二、平方和与自由度的剖分 在方差分析中是用样本方差S2即均方MS(mean squares) 来度量资料的变异程度。 总变异=处理间的变异+处理内的变异,总均方 (MST/S2T),处理间均方 (MSt/S2t),处理内均方 (MSe/S2e),总均方 (MST/S2T),处理间平方和+处理内平方和 SST=SSt+SSe,分子总平方和(SST),分母总自由度(dfT),处理间自由度+处理内自由度 dfT=dft+dfe,(一)总平方和的剖分 在表6-1中,反映全部观察值总

7、变异的总平方和是各观察值与总平均数的离均差平方和,记为SST。即 因为,为各处理平均数与总平均数的离均差平方和与重复数n的乘积,反映了重复n次的处理间变异,称为处理间平方和,记为SSt,即,为 各处 理内离均差平方和之和,反映了各处理内的变异即误差,称为处理内平方和或误差平方和,记为SSe,即,三种平方和的简便计算公式如下: 其中, 称为矫正数。,(二)总自由度的剖分,各部分平方和除以各自的自由度分别得到总均方、处理间均方和处理内均方,分别记为MST(或ST2 )、 MSt(或St2 )和MSe(或Se2 ),即 MST= ST2 =SST/dfT MSt= St2 =SSt/dft MSe=

8、 Se2 =SSe/dfe 注意: 在方差分析中不涉及总均方的数值,所以一般不必计算;总均方一般不等于处理间均方加处理内均方(?)。,方差分析表,【例6.1】 某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果,选取了条件基本相同的鱼20尾,随机分成四组, 投喂不同饲料 ,经一个月试验以后,各组鱼的增重结果列于下表,问这四种不同配比的鱼饲料的饲喂效果有没有差别?。,表6-2 饲喂不同饲料的鱼的增重 (单位:10g),这是一个单因素试验,处理数k =4,重复数n=5。各项平方和和自由度计算如下: 矫正数 C=x2./kn=550.82/(45)=15169.03 总平方和 处理间平方和 =1/5

9、(155.92+131.42+123.72+139.82)-C =15283.3-15169.03=114.27 处理内平方和 SS e=SST -SSt=85.40,总自由度 dfT =kn-1=54-1=19 处理间自由度 dft=k-1=4-1=3 处理内自由度 dfe =dfT- dft=19-3=16 因为方差分析中不涉及总均方的数值,所以不必计算之。,三、F 分布与F 测验,(一) F 分布( F-distribution) 设想作这样的抽样试验,即在一正态总体N(0, 2)中随机抽取样本含量为n的样本k个,将各样本观察值整理成表6-1的形式。 每一样本算出方差S2/MS,统计学上

10、把任意两个方差之比值称为F 值。即 F= MS1/ MS2,F具有两个自由度: df1 ,方差分析中即为dft=k-1 df2 ,方差分析中即为dfe=k(n-1) 若在给定的k和n的条件下,继续从该总体进行一系列抽样,则可获得一系列的F值。 这些F值所具有的概率分布称为F分布。,F分布密度曲线是随自由度df1 、df2的变化而变化的一簇偏态曲线,其形态随着df1 、df2的增大逐渐趋于对称,如图6-1所示。 F分布的取值范围是(0,+),其平均值F =1。,图6-1 几种自由度的F分布,附表3列出的是不同df1和df2下,P(FF)=0.05和P(FF)=0.01时的F值,即右尾概率=0.0

11、5和=0.01时的临界F值,一般记作 和 。 其中df1=dft, df2=dfe。,(二)F 测验 用F 值出现概率的大小推断两个方差是否相等的方法称为F检验(F-test)。 在方差分析中所进行的F 检验目的在于推断处理间的差异是否存在。 在计算F值时总是以被检验因素的均方作分子,以误差均方作分母。,实际进行F 检验时,是将由试验资料所算得的F值与根据df1=dft(大均方,即分子均方的自由度)、df2=dfe(小均方,即分母均方的自由度)查附表4所得的临界F值相比较,作出统计推断。,若F ,即P0.05,不能否定H0, 可认为各处理间差异不显著; 若 F ,即0.01P0.05,否定H0

12、,接受HA,认为各处理间差异显著,标记“*” ; 若F ,即P0.01,否定H0,接受HA, 认为各处理间差异极显著,标记“*”。,不同鱼饲料增重试验的方差分析表,四、多重比较,F值显著或极显著,否定了无效假Ho,表明试验中各处理平均数间存在显著或极显著差异。 但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些没有显著差异。,因而,有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间的差异显著性。 统计上把多个平均数两两间的相互比较称为多重比较。 多重比较的方法甚多,常用的有最小显著差数法(LSD法)和最小显著极差法(LSR法)。

13、,一、最小显著差数法(LSD法) 此法的基本原理是:在处理间F检验显著的前提下, 先计算出显著水平为的最小显著差数LSD ,然后将任意两个处理平均数的差数的绝对值 与其比较,作出结论。 当 LSD,即为在水平上差异显著;反之,即为在水平上差异不显著。,显著水平取0.05和0.01时,从t 值表查出 和 代入上式得:,最小显著差数由下式计算,利用LSD法进行多重比较时,步骤如下: 列出平均数的多重比较表,比较表中各处理按其平均数从大到小自上而下排列; 计算最小显著差数LSD0.05和LSD0.01; 将平均数多重比较表中两两平均数的差数与计算出的LSD0.05 、LSD0.01 比较,作出统计推

14、断,对于【例6.1】,各处理的多重比较如下表 查t值表得 t0.05(dfe)=t0.05(16)=2.120, t0.01(dfe)=t 0.01(16)=2.921 所以显著水平为0.05与0.01的最小的显著差数为:,表6-4 四种饲料对鱼平均增重的多重比较表(LSD法) 将表6-4中的6个差数与LSD0.05 、LSD0.01比较:小于LSD0.05者不显著;介于LSD0.05与LSD0.01之间者显著,标记“*”;大于LSD0.01者极显著,标记“*”。结果表明:.,关于LSD 法的应用有以下几点说明: 1、 LSD 法实质上就是t检验法。但它克服了一般t 检验法所具有的某些缺点(检

15、验法检验过程烦琐、无统一的试验误差、估计误差的精确性和检验的灵敏性低);并未解决推断的可靠性降低、犯I型错误的概率变大的问题。 2、LSD法适用于各处理组与对照组比较而处理组间不进行比较的比较形式。,LSD 法的优点在于方法比较简便,克服了一般t 检验法所具有的某些缺点; 但是由于没有考虑相互比较的处理平均数依数值大小排列上的秩次,故仍有推断可靠性低、犯型错误概率增大的问题。 为克服此弊病,统计学家提出了最小显著极差法。,二、最小显著极差法(LSR法) LSR 法的特点:把平均数的差数看成是平均数的极差,根据极差范围内所包含的平均数个数k (称为秩次距)的不同而采用不同的检验尺度,以克服LSD

16、法的不足。 1、新复极差法(邓肯氏法) 此法是由邓肯(Duncan)于1955年提出,故又称邓肯氏法,此法还称SSR法。,其中SSR(dfe,k) 是根据显著水平、误差自由度dfe、秩次距k,由SSR表(附表4)查得的临界SSR值; =0.05和=0.01水平下的最小显著极差为:,对于【例6.1】,已算出 =1.033,依dfe=16 , k=2,3,4,求得各最小显著极差。所得结果列于表。 表6-5 SSR值与LSR值,表 四种饲料对鱼平均增重的多重比较表(SSR法) 表6-5中,极差1.54、1.68,3.22的秩次距为2,因此将它们与最小显著极差3.099、4.266比较;极差3.22,4.90的秩次距为3,将其与3.254、4.483比较;极差6.44的秩次距为4,它们与3

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 幼儿/小学教育 > 其它小学文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号