生物统计学课件 5、方差分析㈠

上传人:tia****nde 文档编号:71173248 上传时间:2019-01-19 格式:PPT 页数:33 大小:660.31KB
返回 下载 相关 举报
生物统计学课件 5、方差分析㈠_第1页
第1页 / 共33页
生物统计学课件 5、方差分析㈠_第2页
第2页 / 共33页
生物统计学课件 5、方差分析㈠_第3页
第3页 / 共33页
生物统计学课件 5、方差分析㈠_第4页
第4页 / 共33页
生物统计学课件 5、方差分析㈠_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《生物统计学课件 5、方差分析㈠》由会员分享,可在线阅读,更多相关《生物统计学课件 5、方差分析㈠(33页珍藏版)》请在金锄头文库上搜索。

1、第五章 方差分析(一),第一节 方差分析原理 (一个性质、两个分布、三个假定) 第二节 单向分组数据 (各组观察值个数有相同和不相同之分) 第三节 多向分组数据 (含两向分组、三向分组实例) 第四节 三个假定与数据转换* (正态性、可加性、同质性),第五章要点提示,方差分析是本课程的重点,它与试验研究联系最为密切。学习时要从完全随机设计(单向分组)的试验数据着手,结合显著性检验的知识,深刻理解方差分析原理的全部内涵,即一个性质、两个分布和 三个假定(某些情况下作数据转换的必要性); 区分LSR法多重比较与t-test的异同点; 重点掌握单因素随机区组和拉丁方试验结果的方差分析法,能熟练地运用字

2、母法标记多重比较结果。 涉及教材内容:第六章第一、二、五节,第十二章第五、六、七节。 作业布置:教材第六章第四节内容自习;教材P131135 T1、 T3、 T4、 T11、 T12、T13、 T20 、T21 、 T22 ,教材P268269 T7、 T8、 T13。,第一节 方差分析原理,方差分析(analysis of variance),缩 写词原为ANOVA, 现在也用AOV。 它是对多个样本平均数进行假设测 验的方法, 因为对三个以上的平均数差 异进行比较时, 采用只能就一个或两个 样本平均数差异进行显著性测验的方法 已不敷应用,例如: 例5.1 某水产研究所为了比较 k=4种 不

3、同配合饲料对鱼的饲喂效果,选取了 条件基本相同的鱼20尾,随机分成4组 , 投喂不同饲料,一个月后每个处理各得 n= 5个增重观察值,且T=550.8, =27.54, 试予分析。 解 本例需要分析两个方面的问题: 鱼经不同饲料投喂后增重是否 有显著差异(即存在本质差别)? 若有显著差异的话, 在哪些饲料之间?,如果按第三章的方法, 直接进行显著性检验, 就要孤立地对以下6个两两差数做t-test,即: 顺序 t t24.74 t26.28 t27.96 A1 31.18 6.44 4.9 3.22 A4 27.96 3.22 1.68 A2 26.28 1.54 A3 24.74,第一节 方

4、差分析原理,把一份完整的原始数据部分地撇开, 孤立地对两两差数进行t-test,其消极后 果佛克伦这样描述过: 从同一总体中抽样, 每次抽两个样本 得1和2后求算 t 值, 若指定它超过某 值的概率为5%的话, 该值就是两尾表中 查得的临界值 t0.05 再以相同的样本容 量每次抽三个样本, 用最大的样本和 最小的样本求算 t 值, 此时它超过“t0.05 ” 的概率上升到14.3% ( 即“t0.05 ” = t0.143) 继续以相同的容量每次抽四个样本, 仍以最大的和最小的求算t 值, 则 上升到26.5%( 即 “t0.05 ”= t0.265 )以此 类推5个样本40%以上。,比如本

5、例针对药剂A1与药剂A3的两两差数6.44 (最大 最小) 进行的t-test: F= S大2 / S小2 =41.67/415.97/4 F0.05 Se2 = (SS1 + SS2) / (1+2) = 57.64/8 S 1-2 =Se2 ( 1/n1 + 1/n2 ) = 1.70 t =( 1- 2 ) (1-2) S1- 2 = 6.44 1.70 = 3.8 “t0.05”=2.306 由于撇开A、B孤立地进行,否定HO的把握不到80%。,第一节 方差分析原理,一、数据整理 根据方差分析的先决条件,在“三个 假定”成立的前提下,对右表继续整理: C= T 2/nk = 550.8

6、 2/20 = 15169.03 SST =(Y ) 2 = Y 2 C =31.92 +28.52 15169 = 199.67 dfT = nk 1= 5 4 1 = 19 二、平方和、自由度的分解 Y = (Yt) + ( t ) 两边同时平方,得: (Y )2 = (Y t) 2 + ( t ) 2 +2 (Y t) ( t ) 由同一处理重复观察值的累加: (Y)2=(Yt) 2 + (t ) 2 +2 ( t ) (Y t) = 0 (Y )2=(Y t) 2 + n ( t ) 2,再把全部处理观察值的累加,得: (Y )2=(Yt) 2 + n ( t ) 2 即: SST =

7、 (组内) SSe + (组间) SSt 其中 SSt = n ( t ) 2 = Tt 2 /n C = (155.9 2 +131.4 2 +123.7 2 +139.8 2 )/ 5 15169.03 = 114.27 于是SSe = SST SSt = 199.67 114.27 = 85.4 = SS1 + SS2 + SS3 +SS4 = 41.67 +5.43 +15.97+22.33 dft = k 1= 3 dfe= dfT dft =193 = df1 + df2 + df3 +df4= 4 +4 +4+4 = 16,第一节 方差分析原理,三、列ANOVA表,进行F-tes

8、t 变异来源 DF SS MS F F 0.01 处理 3 114.27 38.09 7.13 * 5.29 误差 16 85.4 5.34 总 19 199.67 ( F值右上角标一个 * 达到0.05, 标两个 * 达到0.01 ) 这里进行的F-test与第三章(Ho:大2 小2 ) 的相同之处是都做右尾测验, 查的是同一张F 临界值表;不同之处是固定用误差方差Se 2作 分母(Ho:t2 e2 ), 而不论其相对大小。 显然, F值越大, 说明处理效应引起的数据变 异不仅在量的方面所占比重较大, 而且相对于 误差引起的变异来讲显得越重要、越突出; 本 例F-test结果显示极显著, 表

9、明原始数据的总变 异主要由不同的饲料种类引起, 各处理之间至 少有两个存在着(极)显著差异。,以上一、二、三就是R.A.Fisher创建的方差分析法,其原理归纳如下: 平方和与自由度的可加性; SST 综合了全部观察值的变异量, 它汇总了各变异来源 (SOV) 导致原始数据和全试验平均数 ( ) 出现差异的分量, 包括可控因素分量和误差分量两类; “可加性” 证实前者就是观察值按可控因素分组后算得的组间平方和 ( 可控因素可以是试验因素, 也可以是象单位组那样的其它系统因素 ) 。 试验设计有几个可控因素, 数据就会有几种可能的分组方式, 也就可以算出几个组间SS, 而本属于组内SS的误差分量

10、在平方和分解时总是由SST 减去所有可控因素SS得到, 因此它又被称为“剩余平方和”。 自由度的剖分与平方和的剖分一一对应。 依据F分布进行整体测验; 只确定可控因素分量和误差分量的相对 重要程度是否达到显著水平。,第一节 方差分析原理,四、多重比较 R.A.Fisher 创建的方差分析法并没有明确 (极)显著差异究竟存在于哪些 “组平均数” 之间, F值(极)显著所包含的信息只有通过 对C2n= k(k-1)/2个两两差数进行多次连续性 测验才能完全揭露出来,这就是多重比较。 多重比较不论用哪一种方法, 区别于多 次孤立的 t-test 或者说体现其“连续性” 特征 之处有两个, 一是必须使

11、用同一个共用的标 准误, 记为“SE”), 本例SEMSe / n 5.345 =1.033 (10g); 二是所依据的抽样分 布由计算MSe即Se2的自由度dfe决定, 并根据 两两差数秩次距“k”的不同而有所修正。如 本例k = 2、3、4,测验时依据dfe=16的 t 分 布并在k = 3和4时修正为SSR分布如右。,顺序 t t24.74 t26.28 t27.96 A1 31.18 6.44 4.9 3.22 A4 27.96 3.22 1.68 A2 26.28 1.54 A3 24.74,=16,k =2 SSR= t2,=16,k =3,=16,k =4,3.23 3.15 3

12、.00 ,第一节 方差分析原理,附表6 列出了各自由度对应的t 分布曲线 再按9 种秩次距修正出来的SSR分布当两尾 概率取0.05和0.01时临界值,记为SSR0.05和 SSR0.01,其中k =2的那一条因为实际就是 t 分布曲线压缩横坐标刻度所得, 所以表中列 出的SSR0.05和SSR0.01就分别等于附表3所列 t0.05 和t0.01的2 倍; 其它k3的SSR分布随 着P的递增, 对 t 分布的修正幅度加大, 因此 表中列出的SSR0.05和SSR0.01也就随之递增。 多重比较测验两两差数的显著性时不是 将它除以SE转换成SSR(也是标准化变量!) 后再与SSR0.05 和S

13、SR0.01 比大小, 而是先将 SSR0.05和SSR0.01乘以SE算出“显著尺”LSR, 再将它们直接和相应秩次距的两两差数比 大小, 超过LSR0.05标*, 超过LSR0.01 标*。,顺序 t t24.74 t26.28 t27.96 A1 31.18 6.44 * 4.9 * 3.22 * A4 27.96 3.22 ns 1.68 ns A2 26.28 1.54 ns A3 24.74,=16,k =2 SSR= t2,=16,k =3,=16,k =4,3.23 3.15 3.00 ,第一节 方差分析原理,按照两两差数在三角梯形表中的排列规 律,本例多重比较过程列表如下:

14、LSR0.05= SE SSR0.05 LSR0.01= SE SSR0.01 顺序 t t24.74 t26.28 t27.96 A1 31.18 6.44 * 4.9 * 3.22 * A4 27.96 3.22 ns 1.68 ns A2 26.28 1.54 ns A3 24.74 SE = 1.033,综合包括多重比较在内的方差分析 全过程,其原理可归纳为: 一个性质(SS、DF的可加性) 两个分布(F分布和SSR分布) 本例根据SSR分布进行的多重比较 叫新复极差测验, 简称SSR-test 。因为 不能缺少 F-test 显著的前提,属于 Fishers protected multipe comparisons. 此前产生的复极差测验 (简称q-test、又 称SNK测验) 却可以不经过F-test, 原因 是q-test算LSR时要改查q 值表(附表5), 所依据的q分布是按极差抽样分布原理 要保证各比较都是同一显著水平, 因 而对 t 分布修正幅度随秩次距k的递增 而加大的速度要比SSR分布快, 所以秩 次距k3 时q0.05和q0.01 比相应的SSR0.05 和SSR0.01大。,第二节 单向分组数据,单向分组数据指观察值仅按一个方 向分组的数据。如例5.1中将全部供试单 位(试验材料)随机地分成若干组,然后 各组给以不同处理,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号