第六章方差分析－金锄头文库

资源描述

《第六章方差分析》由会员分享，可在线阅读，更多相关《第六章方差分析（48页珍藏版）》请在金锄头文库上搜索。

1、第六章方差分析方差分析的基本功能对多组处理的样本平均数差异的显著性进行检验 t测验和U测验可以判断两组数据平均数间的差异显著性而方差分析既可以判断两组又可以判断多组数据平均数之间的差异显著性或许有人会说我们可以把多组数据化成几个两组数据用几次t检验来完成这个多组数据差异显著性的判断那不用方差分析不是也可以吗到底这种方法行不行对多个处理进行平均数差异显著性检验时采用t检验法的缺点 1 检验过程繁琐试验包含3个处理 t检验 C32 3次试验包含8个处理 t检验 C82 28次还可以嘛啊 2 无统一的比较标准 t检验 C42 6次需计算6个标准误比较时就没有统一的标准

2、 3 犯第一类错误概率增加例如我们用t检验的方法检验4个样本平均数之间的差异显著性 0 05 t检验 C42 6次 6次检验相互独立 H0的概率 1 0 95 6次都接受H0的概率 0 95 6 0 735 犯错误的概率 1 0 735 0 265 0 05 犯错误的概率明显增加第一节方差分析的基本原理一方差分析的基本思想目的和用途方差又叫均方是表示变异程度的量在一个多处理试验中可以得出一系列不同的观测值观测值不同的原因处理效应 treatmenteffect 处理不同引起试验误差试验过程中偶然性因素的干扰和测量误差所致方差分析的基本思想总变异处理效应试

3、验误差第一节方差分析的基本原理方差分析的目的确定各种原因在总变异中所占的重要程度处理效应试验误差相差不大说明试验处理对指标影响不大相差较大即处理效应比试验误差大得多说明试验处理影响是很大的不可忽视第一节方差分析的基本原理方差分析的用途 1 判断每个因素水平间的差异显著性 2 判断各因素间交互作用显著性 3 用于方差的同质性测验第一节方差分析的基本原理二方差分析的步骤 1 平方和与自由度的分解先看下面的例题这是一个单因素完全随机试验第一节方差分析的基本原理总变异处理效应试验误差平方和的分解第一节方差分析的基本原理通过前面的平方和的直观分解可以看出

4、当然也可以由公式推导出来因为所以 SSe SSt 第一节方差分析的基本原理自由度的分解总自由度处理项自由度误差项自由度第一节方差分析的基本原理例以4种药剂处理水稻种子其中A为对照每处理各得4个苗高观察值其结果如下表试分解其平方和与自由度第一节方差分析的基本原理根据矫正数公式进行平方和的分解第一节方差分析的基本原理 2 列方差分析表进行F测验求均方第一节方差分析的基本原理 F分布与F测验从一个正态总体N中分别随机抽取两个独立样本分别求得其均方和将S12和S22的比值定义为F 第一节方差分析的基本原理不同自由度下的F分布曲线第一节方差分析的基本原

5、理 F分布的特点 1 是平均数取值区间为 0 的一组曲线 2 在F分布是反向J型在时曲线转为偏态 3 F分布下一定区间的概率可以通过书中的附表5查得附表5是各种v1和v2下右尾概率为0 05和0 01时的临界F值表该表时专供测验S12的总体方差是否显著大于S22的总体方差而设计的第一节方差分析的基本原理第一节方差分析的基本原理例测定东方红3号小麦的蛋白质含量10次得均方S12 1 621测定农大139小麦的蛋白质含量5次得均方S22 0 135 试测验东方红3号小麦蛋白质含量的变异是否比农大139为大假设H0 东方红小麦总体蛋白质含量的变异和农大139一样即H0 12

6、 22 对HA 12 22 显著水平取a 0 05 测验计算 F 1 621 0 135 12 01v1 9 v2 4时 F0 05 6 00 此F F0 05 即P 0 05 推断否定HO 接受HA 即东方红3号小麦蛋白质含量的变异大于农大139 对一组处理的重复试验数据经对总平方和与总自由度的分解估计出处理间的均方和处理内均方误差均方并通地F MSt MSe测验处理间所表示出的差异是否真实比误差大这一方法即为方差分析法这里所测验的统计假设是H0 t2 e2或 A B C D对HA t2 e2或 A B C和 D间存在差异不一定 A B C和 D间均不等可能部分不等第一节方

7、差分析的基本原理不同药剂处理水稻苗高的方差分析表第二节多重比较上节通过F测验可以推论处理间是否有显著差异但是对于有些试验其目的不仅在于了解一组处理间总体上有无实质性差异更在于了解哪些处理间存在真实差异故需进一步来做具体的处理平均数间的比较多重比较有多种方法本节将介绍常用的两种最小显著差数法 LSD法和新复极差法 LSR法第二节多重比较一最小显著差数法 LSD法最小显著差数 LeastSignificantDifference 简称LSD法 LSD法实质上是t测验其基本原理是在处理间的F测验为显著的前提下计算出显著水平为a时的最小显著差数LSDa 任何两个平均数

8、的差数如 LSDa 即为在a水平上差异显著反之则为在a水平上差异不显著这种方法又称为F测验保护下的最小显著差数法一多重比较的原理第二节多重比较二新复极差法 LSR法 LSD法实质上是t测验但是t测验只适用于两个独立随机样本差异显著性测验但多重比较中包括着多个样本这多个样本中平均数最大的一个与平均数最小的一个比较实际上已不再是一对独立随机样本的比较用t测验必然增大I型错误的概率容易接受不真实的备择假设为此D B Duncan提出了新复极差法又称最小显著极差法 shortestsignificantranges SSR 第二节多重比较其方法是把多个样本中两个

9、极端平均数的差数当作极差对待如果极差不显著则包括在这两个极端处理平均数间的各处理平均数的任何成对比较其差异也是不显著的极差是否显著用极差相当于均数标准差的倍数 SSR R S式中R为极差 SSR为极差相当于均数标准差的倍数在一定自由度下当平均数个数为2 3 k时 SSR值已由统计学家求出见课本附表8 这样只要计算出S 从附表8中查出SSR 就可以计算出LSR 第二节多重比较二多重比较结果的表示方法一列梯形表法将全部平均数从大到小顺次排列然后算出各平均数间的差数凡达到a 0 05水平的差数在右上角标一个号凡达到a 0 01水平的差数在右上角标两个号凡未达到a

10、0 05水平的差数则不予标记若以列梯形表示上题资料的差异显著性新复极差测验第二节多重比较二标记字母法首先将全部平均数从大到小依次排列先以最大平均数为准减去最小的次最小的直到其差数小于相应的LSRa 即不显著为止把最大平均数到与其差数不显著的那个平均数之间的各平均数含最大平均数和与其差数不显著的那个平均数后都标上字母a或A 再以次大平均数为准减去最小次最小直到其差数小于相应的LSRa 即不显著为止把这一轮比较中次大平均数到与其差数不显著的那个平均数之间的各平均数后都标上字母b或B 余类推直到最小一个平均数标上字母为止整个标记字母过程结束第二节多重比较第

11、二节多重比较三多重比较方法的选择通过多重比较可以看出 LSD法只用了一个标准而LSR根据极差的两个极端平均数间的平均数个数多少用了多个标准 LSR法只包括两个处理平均数的极差测验所用的LSR等于LSD 所以在多重比较中有时两处理比较时LSD法测验达显著水平但LSR法测验却不一定达显著水平即LSR法测验的显著水平高于LSD法试验的处理间如果设有对照各处理与对照的比较或预先安排的个别成对比较相当于两个独立随机样本平均数的比较一般可选用LSD法否则应使用LSR法第二节多重比较综上所述方差分析的基本步骤是 1 自由度和平方的分解 2 列方差分析表并进行F测验 3 若F测

12、验显著则对各平均数进行多重比较第三节方差分析的线性模型与期望均方一方差分析的线性数学模型方差分析是建立在一定的线性可加模型基础上的所谓线性可加模型是指总体每一个变量可以按其变异的原因分解成若干个线性组成部分的数学表达式它是方差分析的理论依据第三节方差分析的线性模型与期望均方平均 T yij Tk Ti T2 T1 总和 yk1yk2 ykj ykn yi1yi2 yij yin y21y22 y2j y2n y11y12 y1j y1n 12 j n k i 2 1 处理重复假定有k组观测数据每组有n个观测值则共有nk个观测值第三节方差分析的线性模型与期望均方 yij

13、 i ij 用线性模型 linearmodel 来描述每一观测值总体平均数 i 处理效应 ij 试验误差 yij 是在第i次处理下的第j次观测值第三节方差分析的线性模型与期望均方对于由样本估计的线性模型为第三节方差分析的线性模型与期望均方二期望均方根据的 i不同假定可将数学模型分为以下三种固定模型随机模型混合模型一固定模型 fixedmodel 指各个处理的效应值 i是固定值各个的平均效应 i i 是一个常量且 i 0 就是说除去随机误差以后每个处理所产生的效应是固定的实验因素的各水平是根据试验目的事先主观选定的而不是随机选定的例以5个水稻品种作大区比较试验

14、每品种作3次取样测定其产量所得资料为单向分组资料本试验需明确各品种的效应故为固定模型其方差分析和期望均方的参数估计如下表固定模型的F测验若 i 0 则F的期望值等于1 所以固定模型假设测验H0 i 0对HA i 0 第三节方差分析的线性模型与期望均方 1 在固定模型中除去随机误差之后的每个处理所产生的效应是固定的试验重复时会得到相同的结果 2 方差分析所得到的结论只适合于选定的那几个水平并不能将其结论扩展到未加考虑的其它水平上特点第三节方差分析的线性模型与期望均方第三节方差分析的线性模型与期望均方二随机模型指各处理的效应值 i不是固定的数值而是从平均数为零方

15、差为 2的正态总体中得到的一个随机变量主要是研究并估计总体变异即方差这里 i是一个随机变量是从期望均值为0 方差为 2的标准正态总体中得到的随机变量得出的结论可以推广到多个随机因素的所有水平上第三节方差分析的线性模型与期望均方如果某些试验条件不能人为控制或通过样本对所属总体做出推断时属于随机模型例如将从美国引进的玉米在不同纬度生态条件下的情况来观察该品种对不同地理条件的适应情况这时各地的气候水肥土壤条件是无法人为控制的就要用随机模型来处理随机模型得出的结论可以推广到多个随机因素的所有水平上第三节方差分析的线性模型与期望均方 1 在随机模型中水平确定之后其处理所产生

16、的效应并不是固定的试验重复时也很难得到相同的结果 2 方差分析所得到的结论可以推广到这个因素的所有水平上特点固定模型与随机模型的比较 1 两者在设计思想和统计推断上有明显不同固定模型中所得的结论仅在于推断关于特定的处理而随机模型中的结论将用于推断处理的总体 2 二者分析的侧重点也不完全相同在期望均方和F测验方面也不一样固定模型主要侧重于效应值的估计而随机模型则侧重效应方差的估计和测验第三节方差分析的线性模型与期望均方三混合模型指在多因素试验中既有固定因素又有随机因素时所用的模型在试验设计中固定模型应用最多随机模型和混合模型相对较少第三节方差分析的线性模型与期望均方第四节方差分析的基本假定与数据转换一方差分析的三个基本假定 1 效应的可加性即处理效应与环境效应应为线性可加也即总变异的分解分解时应按照其线性可加模型进行分解 2 误差的正态性即试验误差为独立的随机变数并作正态分布 3 误差方差的同质性即所有试验处理具有共同的误差方差第四节方差分析的基本假定与数据转换二不符合方差分析基本假定数据的处理方法当试验中的试验数据不符合以上三点基本假

展开阅读全文

第六章 方差分析

最新文档

第六章方差分析