《8(3)方差分析培训资料》由会员分享,可在线阅读,更多相关《8(3)方差分析培训资料(74页珍藏版)》请在金锄头文库上搜索。
1、方差分析,(续),第四节 两因素资料的方差分析,两因素资料的方差分析,又称为双向分组资料的方差分析 很多情况下,我们需要设计两种不同的因素同时作用于供试动物 或在考虑某一因素对供试动物产生影响的同时,还需要考虑不同的环境情况 这样,当试验结束后,数据的分析就必须进行两因素(或称双向分类资料)的方差分析 同时考虑的这两个因素,我们分别称之为因素 A 和因素 B,他们各有 a个水平和 b个水平,根据每一个组合内是一个独立供试动物还是多个独立供试动物,双向分类资料又可分为组合内无重复观测值和组合内有重复观测值两种情况 一、组合内无重复观测值的两向分类资料的方差分析 这种类型的资料结构是每一组合内仅一
2、个独立供试动物(独立供试单位) 其观测值的数学模型为:,这一模型的含义是:每一个观测值 包含了总体平均值 ,同时还受 A因素第 个水平的效应和 B因素第 个水平的效应,同时还具有一定的误差 : 这一模型相应的数据结构为: 因素 T : : T T,上页的数据结构表中,T为求和,不同因素的和的下标不同 两因素无重复资料的方差分析应从 A 和 B 两个方向进行,我们可以将这种结构看成是两个单向资料的重合 即:对 A因素来说,有 a个组(k = a),每一组有 b个观测值(n = b) 对 B因素来说,有 b个组(k = b),每一个组有 a个观测值(n = a) 因此我们可以直接用方差分析表来表示
3、这种分剖的结果 这里,无效假设有两个:,A:设 不全相等 B:设 不全相等 方差分析表 course A因素 B因素 误 差 T,若 显著,应对 A因素各水平的平均值进行多重比较,其标准误为: 若 显著,应对 B因素各水平的平均值进行多重比较,其标准误为: 下面我们以实例来说明具体分析的过程 试验 4种药物配伍(因素 A)对仔猪白痢的治疗效果,试验在 5个发病的猪场(因素B)进行,每个猪场随机抽取 4个猪舍小区,每个猪舍小区随机使用其中的一种药物配伍,得如下治愈率,试比较这 4种药物配伍的治疗效果,药物 猪 场 配伍 76 82 83 79 77 83 89 92 87 84 73 77 80
4、 72 80 81 82 79 85 87 由于数据是百分率,因此应作转换: 转换后的数据见下面这张表:,药物 猪 场 配伍 60.67 64.90 65.65 62.73 61.34 65.65 70.63 73.57 68.87 66.42 58.69 61.34 63.43 58.05 63.43 64.16 64.90 62.72 67.21 68.87,得如下一级数据: 药物 猪 场 配伍 315.29 19900.4299 345.14 23865.7576 304.94 18623.6440 327.86 21522.5750 B1 B2 B3 B4 B5 A1 63.06 2.
5、17 249.17 261.77 265.37 256.86 260.06 A2 69.03 3.22 A3 60.99 2.55 T = 1293.23 x2 = 83915.6610 A4 65.57 2.46,设 不全相等 设 不全相等,将上述数据填入方差分析表中: 方差分析表 Course 药物间 3 179.8240 59.94 9.61* 3.49 5.95 猪场间 4 37.5225 9.47 1.52 3.26 误 差 12 74.8287 6.24 T 19 292.8297 对于 A因素,应否定无效假设,即不同的药物配伍其治疗仔猪白痢的疗效差异极显著(p0.05),由于药物
6、配伍间差异极显著(p0.01),因此应对其作多重比较 而猪场间差异不显著,没有必要进行多重比较(场间差异也不是我们讨论的重点,因此即使差异显著也不必进行多重比较) 2 3 4 0.05 0.01 3.08 3.77 4.20 69.03 a A 4.32 5.05 5.50 65.57 b AB 3.45 4.22 4.70 63.06 bc B 4.84 5.66 6.16 60.99 c B,作平均数比较图: 在作图前,应将各平均值数据转换回原百分率 其反转换公式: 63.06 69.03 60.99 65.57 79.5% 87.2% 76.5% 82.9% 90 85 80 75 图1
7、 不同药物配伍仔猪白痢治疗效果比较(下面的注略),在无重复的两因素资料中,B因素往往是作为区组使用的,如牧场、畜舍、地域等,由于在兽医统计学中一般不作牧场等的比较,因此,即使 B因素显著或极显著,也不对其作多重比较,只有当专门研究场间差异时才对此作多重比较,在试验中设置区组,其作用是统计分析时消除系统误差,即当我们怀疑不同的区组(牧场等)存在系统误差,或将一个试验有意识地分散在不同的地域、以检验试验内容是否可以适应不同的地域时一般可以设置区组: 一是通过区组消除系统误差 二是检验试验内容是否具有广泛的适应性,当 B因素的 F值小于 1(即表示区组基本不具有系统误差)、而 A因素还未达到显著水平
8、时,还应当将B因素的平方和、自由度合并到误差项中去,得到一个新的误差项均方,以降低误差项的均方值,同时增大误差项的自由度,使得 A因素比较容易地达到显著水平 这种情况由于消除了 B因素,其实就变成了单因素(仅考虑 A因素)资料的方差分析了,当 B因素的 F值稍大于 1(亦表示基本没有系统误差)是否需要将其合并到误差项中去,这需要根据具体情况而定:凡能帮助 A因素达到显著或极显著水平的,就应当合并;反之,就不合并,A因素是我们所要研究的对象,B因素的设置只是为了消除系统误差,因此 B因素就没有 A因素来得重要,两者的地位是不等的,但在方差分析中,我们还是应当将其作为一个因素来考虑 在考虑 B因素
9、的设置时,一定要注意 B因素不能和 A因素之间产生相互作用(简称为互作),否则这种互作就会存在于误差项中而析不出来 因此 B因素一般只能是地域、时间等非试验因子,而不能是可能成为试验的条件,如果在试验前无法判断所设置的 B因素是否会与A因素存在互作,那么就应当用下面的方式进行试验,二、组合内有重复观测值的两因子资料的方差分析 当 A、B两个因子都是试验所考察的因子,即在一个试验中同时安排了两个因子,这两个因子之间有可能存在互作,或怀疑其间存在互作,我们就应当在每个组合内安排 2个或以上的独立供试单位(或独立供试动物) 这样的试验所得到的数据就是组合内有重复观测值的资料,设 A因素有 a个水平,
10、B因素有 b个水平,共有 ab个组合,每一个组合内有 n(n1)个观测值,整批资料共有 abn个数据,这样的资料就是组合内有重复观测值的两因子资料 这种类型资料的数学模型为: 数据结构见本书 P83表 5-22(请参看),任一观测值 包含了总体效应 ,A因子第 个水平的效应,B因子第 个水平的效应,A 因子和 B因子第 、 个互作效应,及随机误差 ,随机误差 这一类资料的方差分析表为:,方差分析表 变异 自由度 平方和 均方 F值 来源 A a-1 B b-1 AB (a-1)(b-1) e ab(n-1) T abn-1,在这种类型资料的方差分析中,人们的注意力和兴趣往往集中于互作的检验上,
11、一般首先完成互作的 F检验 如果互作部分的 F检验显著,可不再进行 A因子、B因子的检验(当然习惯上我们还是同时完成 A因子、B因子的检验),而对组合进行多重比较,因为互作的重要性要远大于单个因子的重要性,它所提供的信息量比单个因子要丰富得多,因此,一般的试验应当同时考察两个因子,这样做,一是可以节省时间和财力,二是可以考察因子之间的关系,这种关系在单个因子的试验中是考察不到的 当互作不显著,则分别检验 A因子和 B因子是否显著,哪个因子显著,就对哪个因子进行多重比较 两个因子都显著,两个因子都应当作多重比较,考察两因子的试验中,什麽时候在组合内设置重复? 一是当我们确认试验所设置的 A因子和
12、 B因子间的确存在互作,我们为了检验这种互作 二是当我们无法肯定 A、B因子之间是否存在互作,我们为了发现这种互作,必须设置重复 三是为了防止可能存在的互作混杂到误差项中去而无谓地扩大误差,因此必须设置重复,下面我们用实例来说明这一类型资料的方差分析(本书 PP8485例 5-7) 试验目的:观察不同细菌经不同修饰后其细胞表面凝集素的化学性质 A因子:对细菌的三种修饰方式(a=3): :高碘酸钠 :胰蛋白酶 :蛋白酶 B因子:三种细菌(b=3): :大肠杆菌 :乳酸菌 :双歧杆菌 每个组合内有 4个重复(n=4):4头仔猪 观测指标:固化仔猪小肠黏液蛋白的相对附着量,试验所得数据结构见下表 (
13、习惯上,我们总是将细菌作为 A因素,修饰方式作为 B因素),修饰 细 菌 方式 62.70 60.50 5.02 7.81 102.31 110.20 65.30 59.78 3.24 3.65 108.45 103.84 692.80 =248.28 =19.72 =424.80 20.30 23.51 34.50 37.21 120.73 114.92 17.92 19.35 31.92 31.05 117.22 124.73 693.36 = 81.08 =134.68 =477.60 62.61 59.43 17.82 21.20 103.25 110.23 65.70 62.38 1
14、6.02 14.56 105.73 110.39 749.32 =250.12 =69.60 =429.60 579.48 224.00 1332.00 =2135.48,这是一张二维的数据表 在计算一级数据时,应从最小单位开始,即首先计算组合的和,然后计算 A和 B因子各水平的和,最后计算总和 在逐段计算各类和的时候,不要忘记同时计算平方和、平均数 做好上述准备工作后,即进行校正值、各类平方和及自由度的计算:,各平方和、自由度:,修饰方式 A:设 不全相等 细菌种类 B:设 不全相等 AB:设 不全相等 方差分析表 course 修饰(A) 175.7319 2 87.8660 9.514* 细菌(B)53352.1217 2 26671.0609 2887.979* AB 6623.2556 4 1655.8139 179.294* 误差 249.3500 27 9.2