第六章 方差分析

上传人:012****78 文档编号:132721235 上传时间:2020-05-19 格式:PPT 页数:48 大小:931.50KB
返回 下载 相关 举报
第六章 方差分析_第1页
第1页 / 共48页
第六章 方差分析_第2页
第2页 / 共48页
第六章 方差分析_第3页
第3页 / 共48页
第六章 方差分析_第4页
第4页 / 共48页
第六章 方差分析_第5页
第5页 / 共48页
点击查看更多>>
资源描述

《第六章 方差分析》由会员分享,可在线阅读,更多相关《第六章 方差分析(48页珍藏版)》请在金锄头文库上搜索。

1、第六章方差分析 方差分析的基本功能 对多组处理的样本平均数差异的显著性进行检验 t测验和U测验可以判断两组数据平均数间的差异显著性 而方差分析既可以判断两组又可以判断多组数据平均数之间的差异显著性 或许有人会说 我们可以把多组数据化成几个两组数据 用几次t检验来完成这个多组数据差异显著性的判断 那不用方差分析不是也可以吗 到底这种方法行不行 对多个处理进行平均数差异显著性检验时 采用t检验法的缺点 1 检验过程繁琐 试验包含3个处理 t检验 C32 3次 试验包含8个处理 t检验 C82 28次 还可以嘛 啊 2 无统一的比较标准 t检验 C42 6次 需计算6个标准误 比较时就没有统一的标准

2、 3 犯第一类错误概率增加 例如我们用t检验的方法检验4个样本平均数之间的差异显著性 0 05 t检验 C42 6次 6次检验相互独立 H0的概率 1 0 95 6次都接受H0的概率 0 95 6 0 735 犯 错误的概率 1 0 735 0 265 0 05 犯 错误的概率明显增加 第一节方差分析的基本原理 一 方差分析的基本思想 目的和用途 方差 又叫均方 是表示变异程度的量 在一个多处理试验中 可以得出一系列不同的观测值 观测值不同的原因 处理效应 treatmenteffect 处理不同引起 试验误差 试验过程中偶然性因素的干扰和测量误差所致 方差分析的基本思想 总变异 处理效应 试

3、验误差 第一节方差分析的基本原理 方差分析的目的 确定各种原因在总变异中所占的重要程度 处理效应 试验误差 相差不大 说明试验处理对指标影响不大 相差较大 即处理效应比试验误差大得多 说明试验处理影响是很大的 不可忽视 第一节方差分析的基本原理 方差分析的用途 1 判断每个因素水平间的差异显著性 2 判断各因素间交互作用显著性 3 用于方差的同质性测验 第一节方差分析的基本原理 二 方差分析的步骤 1 平方和与自由度的分解 先看下面的例题 这是一个单因素完全随机试验 第一节方差分析的基本原理 总变异 处理效应 试验误差 平方和的分解 第一节方差分析的基本原理 通过前面的平方和的直观分解可以看出

4、 当然也可以由公式推导出来 因为 所以 SSe SSt 第一节方差分析的基本原理 自由度的分解 总自由度 处理项自由度 误差项自由度 第一节方差分析的基本原理 例 以4种药剂处理水稻种子 其中A为对照 每处理各得4个苗高观察值 其结果如下表 试分解其平方和与自由度 第一节方差分析的基本原理 根据矫正数公式进行平方和的分解 第一节方差分析的基本原理 2 列方差分析表 进行F测验 求均方 第一节方差分析的基本原理 F分布与F测验 从一个正态总体N中 分别随机抽取两个独立样本 分别求得其均方和 将S12和S22的比值定义为F 第一节方差分析的基本原理 不同自由度下的F分布曲线 第一节方差分析的基本原

5、理 F分布的特点 1 是平均数 取值区间为 0 的一组曲线 2 在F分布是反向J型 在时 曲线转为偏态 3 F分布下一定区间的概率可以通过书中的附表5查得 附表5是各种v1和v2下右尾概率为0 05和0 01时的临界F值表 该表时专供测验S12的总体方差是否显著大于S22的总体方差而设计的 第一节方差分析的基本原理 第一节方差分析的基本原理 例 测定东方红3号小麦的蛋白质含量10次 得均方S12 1 621测定农大139小麦的蛋白质含量5次 得均方S22 0 135 试测验东方红3号小麦蛋白质含量的变异是否比农大139为大 假设H0 东方红小麦总体蛋白质含量的变异和农大139一样 即H0 12

6、 22 对HA 12 22 显著水平取a 0 05 测验计算 F 1 621 0 135 12 01v1 9 v2 4时 F0 05 6 00 此F F0 05 即P 0 05 推断 否定HO 接受HA 即东方红3号小麦蛋白质含量的变异大于农大139 对一组处理的重复试验数据经对总平方和与总自由度的分解估计出处理间的均方和处理内均方 误差均方 并通地F MSt MSe测验处理间所表示出的差异是否真实 比误差大 这一方法即为方差分析法 这里所测验的统计假设是H0 t2 e2或 A B C D对HA t2 e2或 A B C和 D间存在差异 不一定 A B C和 D间均不等 可能部分不等 第一节方

7、差分析的基本原理 不同药剂处理水稻苗高的方差分析表 第二节多重比较 上节通过F测验可以推论处理间是否有显著差异 但是对于有些试验其目的不仅在于了解一组处理间总体上有无实质性差异 更在于了解哪些处理间存在真实差异 故需进一步来做具体的处理平均数间的比较 多重比较有多种方法 本节将介绍常用的两种 最小显著差数法 LSD法 和新复极差法 LSR法 第二节多重比较 一 最小显著差数法 LSD法 最小显著差数 LeastSignificantDifference 简称LSD法 LSD法实质上是t测验 其基本原理是 在处理间的F测验为显著的前提下 计算出显著水平为a时的最小显著差数LSDa 任何两个平均数

8、的差数 如 LSDa 即为在a水平上差异显著 反之 则为在a水平上差异不显著 这种方法又称为F测验保护下的最小显著差数法 一 多重比较的原理 第二节多重比较 二 新复极差法 LSR法 LSD法实质上是t测验 但是t测验只适用于两个独立随机样本差异显著性测验 但多重比较中 包括着多个样本 这多个样本中平均数最大的一个与平均数最小的一个比较 实际上已不再是一对独立随机样本的比较 用t测验 必然增大I型错误的概率 容易接受不真实的备择假设 为此D B Duncan提出了新复极差法 又称最小显著极差法 shortestsignificantranges SSR 第二节多重比较 其方法是把多个样本中两个

9、极端平均数的差数当作极差对待 如果极差不显著 则包括在这两个极端处理平均数间的各处理平均数的任何成对比较 其差异也是不显著的 极差是否显著用极差相当于均数标准差的倍数 SSR R S式中R为极差 SSR为极差相当于均数标准差的倍数 在一定自由度下 当平均数个数为2 3 k时 SSR值已由统计学家求出 见课本附表8 这样只要计算出S 从附表8中查出SSR 就可以计算出LSR 第二节多重比较 二 多重比较结果的表示方法 一 列梯形表法 将全部平均数从大到小顺次排列 然后算出各平均数间的差数 凡达到a 0 05水平的差数在右上角标一个 号 凡达到a 0 01水平的差数在右上角标两个 号 凡未达到a

10、0 05水平的差数则不予标记 若以列梯形表示 上题资料的差异显著性 新复极差测验 第二节多重比较 二 标记字母法 首先将全部平均数从大到小依次排列 先以最大平均数为准 减去最小的 次最小的 直到其差数小于相应的LSRa 即不显著为止 把最大平均数到与其差数不显著的那个平均数之间的各平均数 含最大平均数和与其差数不显著的那个平均数 后都标上字母a或A 再以次大平均数为准 减去最小 次最小 直到其差数小于相应的LSRa 即不显著为止 把这一轮比较中次大平均数到与其差数不显著的那个平均数之间的各平均数后都标上字母b或B 余类推 直到最小一个平均数标上字母为止 整个标记字母过程结束 第二节多重比较 第

11、二节多重比较 三 多重比较方法的选择 通过多重比较可以看出 LSD法只用了一个标准 而LSR根据极差的两个极端平均数间的平均数个数多少用了多个标准 LSR法只包括两个处理平均数的极差测验所用的LSR等于LSD 所以 在多重比较中 有时两处理比较时LSD法测验达显著水平 但LSR法测验却不一定达显著水平 即LSR法测验的显著水平高于LSD法 试验的处理间如果设有对照 各处理与对照的比较或预先安排的个别成对比较相当于两个独立随机样本平均数的比较 一般可选用LSD法 否则应使用LSR法 第二节多重比较 综上所述 方差分析的基本步骤是 1 自由度和平方的分解 2 列方差分析表 并进行F测验 3 若F测

12、验显著 则对各平均数进行多重比较 第三节方差分析的线性模型与期望均方 一 方差分析的线性数学模型 方差分析是建立在一定的线性可加模型基础上的 所谓线性可加模型是指总体每一个变量可以按其变异的原因分解成若干个线性组成部分的数学表达式 它是方差分析的理论依据 第三节方差分析的线性模型与期望均方 平均 T yij Tk Ti T2 T1 总和 yk1yk2 ykj ykn yi1yi2 yij yin y21y22 y2j y2n y11y12 y1j y1n 12 j n k i 2 1 处理重复 假定有k组观测数据 每组有n个观测值 则共有nk个观测值 第三节方差分析的线性模型与期望均方 yij

13、 i ij 用线性模型 linearmodel 来描述每一观测值 总体平均数 i 处理效应 ij 试验误差 yij 是在第i次处理下的第j次观测值 第三节方差分析的线性模型与期望均方 对于由样本估计的线性模型为 第三节方差分析的线性模型与期望均方 二 期望均方 根据的 i不同假定 可将数学模型分为以下三种 固定模型 随机模型 混合模型 一 固定模型 fixedmodel 指各个处理的效应值 i是固定值 各个的平均效应 i i 是一个常量 且 i 0 就是说除去随机误差以后每个处理所产生的效应是固定的 实验因素的各水平是根据试验目的事先主观选定的而不是随机选定的 例 以5个水稻品种作大区比较试验

14、 每品种作3次取样 测定其产量所得资料为单向分组资料 本试验需明确各品种的效应 故为固定模型 其方差分析和期望均方的参数估计如下表 固定模型的F测验 若 i 0 则F的期望值等于1 所以固定模型假设测验H0 i 0对HA i 0 第三节方差分析的线性模型与期望均方 1 在固定模型中 除去随机误差之后的每个处理所产生的效应是固定的 试验重复时会得到相同的结果 2 方差分析所得到的结论只适合于选定的那几个水平 并不能将其结论扩展到未加考虑的其它水平上 特点 第三节方差分析的线性模型与期望均方 第三节方差分析的线性模型与期望均方 二 随机模型 指各处理的效应值 i不是固定的数值 而是从平均数为零 方

15、差为 2的正态总体中得到的一个随机变量 主要是研究并估计总体变异即方差 这里 i是一个随机变量 是从期望均值为0 方差为 2的标准正态总体中得到的随机变量 得出的结论可以推广到多个随机因素的所有水平上 第三节方差分析的线性模型与期望均方 如果某些试验条件不能人为控制或通过样本对所属总体做出推断时属于随机模型 例如将从美国引进的玉米在不同纬度生态条件下的情况 来观察该品种对不同地理条件的适应情况 这时各地的气候 水肥 土壤条件是无法人为控制的 就要用随机模型来处理 随机模型得出的结论可以推广到多个随机因素的所有水平上 第三节方差分析的线性模型与期望均方 1 在随机模型中 水平确定之后其处理所产生

16、的效应并不是固定的 试验重复时也很难得到相同的结果 2 方差分析所得到的结论 可以推广到这个因素的所有水平上 特点 固定模型与随机模型的比较 1 两者在设计思想和统计推断上有明显不同 固定模型中所得的结论仅在于推断关于特定的处理 而随机模型中的结论将用于推断处理的总体 2 二者分析的侧重点也不完全相同 在期望均方和F测验方面也不一样 固定模型主要侧重于效应值的估计 而随机模型则侧重效应方差的估计和测验 第三节方差分析的线性模型与期望均方 三 混合模型 指在多因素试验中既有固定因素又有随机因素时所用的模型 在试验设计中 固定模型应用最多 随机模型和混合模型相对较少 第三节方差分析的线性模型与期望均方 第四节方差分析的基本假定与数据转换 一 方差分析的三个基本假定 1 效应的可加性即处理效应与环境效应应为线性可加 也即总变异的分解分解时应按照其线性可加模型进行分解 2 误差的正态性即试验误差为独立的随机变数 并作正态分布 3 误差方差的同质性即所有试验处理具有共同的误差方差 第四节方差分析的基本假定与数据转换 二 不符合方差分析基本假定数据的处理方法 当试验中的试验数据不符合以上三点基本假

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号