《常用实验设计及其统计分析》由会员分享,可在线阅读,更多相关《常用实验设计及其统计分析(178页珍藏版)》请在金锄头文库上搜索。
1、n n实验实验(experiment)n n试验试验(test)n n一个生物学研究课题是由一个或多个有关联的单项实验构成的。n n一个一个“赖氨酸生产菌改进的例子:赖氨酸生产菌改进的例子:n n1、初始菌株的选择;、初始菌株的选择;n n2、菌株的改进:传统的突变菌株筛选、现代、菌株的改进:传统的突变菌株筛选、现代的基因工程改进法;的基因工程改进法;n n3、赖氨酸含量的测试、分析方法;、赖氨酸含量的测试、分析方法;n n4、赖氨酸的别离方法;、赖氨酸的别离方法;n n5、生产菌在摇瓶规模上的发酵条件优化;、生产菌在摇瓶规模上的发酵条件优化;n n6、生产菌在中试规模和生产规模上的发酵条、生
2、产菌在中试规模和生产规模上的发酵条件优化;件优化;n n7、菌株的保藏方法;、菌株的保藏方法;n n8、种子的放大生产;、种子的放大生产;n n9、生产设备的优化。、生产设备的优化。生物学实验的根本要求生物学实验的根本要求实验设计的三个根本原那么实验设计的三个根本原那么简单实验设计简单实验设计比照设计比照设计成组比较实验设计成组比较实验设计配比照较实验设计配比照较实验设计完全随机分组的实验设计完全随机分组的实验设计随机区组设计随机区组设计拉丁方设计拉丁方设计希腊希腊- -拉丁方设计拉丁方设计裂区设计裂区设计正交设计正交设计Plackett-BurmanPlackett-Burman优化法优化法
3、 第一节第一节 实验设计的根本原理实验设计的根本原理 一、实验设计的根本概念 实验设计,广义理解是指实验研究课题设计,也就是整个实验方案的拟定。主要包括课题的名称、实验目的,研究依据、内容及预期到达的效果,实验方案,实验单位的选取、重复数确实定、实验单位的分组,实验的记录工程和要求,实验 结 果 的 分析方法 ,经济效益或社 会 效 益 估 计 , 已 具 备 的 条 件,需要购置的仪器设备,参加研究人员的分工,实验时间、地点、进度安排和经费预算,成果鉴定,学术论文撰写等内容。而狭义的理解是指实验单位的选取、重复数目确实定及实验单位的分组。生物统计中的实验设计主要指狭义的实验设计。 实验设计的
4、目的是防止系统误差,控制、降低实验误差,无偏估计处理效应,从而对样本所在总体作出可靠、正确的推断。 二、生物学实验的根本要求为了保证实验的质量,在实验中应尽可能地控制和排除非实验因素的干扰,合理地进行实验设计、准确地进行实验,从而提高实验的可靠程度,使实验结果在生产实际中真正发挥作用。为此,对生物实验有以下几点要求: 1、实验要有代表性 生物实验的代表性包括生物学和环境条件两个方面的代表性。 生物学的代表性,是指作为主要研究对象的品种、个体的代表性,并要有足够的数量。例如,进行品种的比较实验时,所选择的个体必须能够代表该品种,不要选择性状特殊的个体,并根据个体均匀程度,在保证实验结果具有一定可
5、靠性的条件下,确定适当的数量。 环境条件的代表性,是指代表将来方案推广此项实验结果的地区的自然条件和生产条件,如气候、饲料、饲养管理水平及设备等。 代 表 性 决定了实验结果的可利用性 ,如果一个实验没有充分的代表性,再好的实验结果也不能推广和应用,就失去了实用价值。 2、实验要有正确性 实验的正确性包括实验的准确性和实验的精确性。 在进行实验的过程中,应严格执行各项实验要求,将非实验因素的干扰控制在最低水平,以防止系统误差,降低实验误差,提高实验的正确性。 3、实验要有重演性 重演性是指在相同条件下,重复进行同一实验,能够获得与原实验相类似的结果,即实验结果必须经受得起再实验的检验。 由于实
6、验受供试个体之间差异和复杂的环境条件等因素影响,不同地区或不同时间进行的相同实验,结果往往不同;即使在相同条件下的实验,结果也有一定出入。因此,为了保证实验结果的重演性,必须认真选择供试个体,严格把握实验过程中的各个环节,在有条件的情况下,进行屡次或多点实验,这样所获得的实验结果才具有较好的重演性。 三、实验设计的根本要素1、处理因素单因素、多因素、处理水平、固定模型、随机模型;与处理因素相对应的是非处理因素,这是引起实验误差的主要来源。2、受试对象处理因素的客体,进行实验设计时,要保证其同质性。3、处理效应实验效应处理效应实验误差 四、实验方案书的编制四、实验方案书的编制1、封面;、封面;名
7、称、编制者、时间名称、编制者、时间2、国内外研究动态及参考文献;、国内外研究动态及参考文献;3、实验目的;、实验目的;实验目的是实验开始前就提出的,不能做这样的实验目的是实验开始前就提出的,不能做这样的“神射手子弹射出后,不管打到哪,都大神射手子弹射出后,不管打到哪,都大言不惭地说言不惭地说“这正是我要打的地方!这正是我要打的地方!4、预期结果;、预期结果;理论方面,可以得到某个规律或结论;实用上,理论方面,可以得到某个规律或结论;实用上,可以到达某个经济效益、社会效益或生态效益。可以到达某个经济效益、社会效益或生态效益。 5、实验因素及因素水平的选择;、实验因素及因素水平的选择;6、观测指标
8、的选择及指标的测量方法;、观测指标的选择及指标的测量方法;7、设计方法的选择;、设计方法的选择;配对设计与成组设计、比照设计、完全随机化设配对设计与成组设计、比照设计、完全随机化设计、随机区组设计、拉丁方设计、裂区设计、套计、随机区组设计、拉丁方设计、裂区设计、套设计、正交设计设计、正交设计8、实验方法;、实验方法;实验材料、仪器设备、药品试剂、实实验材料、仪器设备、药品试剂、实验步骤、实验经费验步骤、实验经费 9、实验记录。、实验记录。不能把实验方案上的数值抄过来,称不能把实验方案上的数值抄过来,称量是多少克就是多少克;量是多少克就是多少克;实验过程中的意外现象不可不记;实验过程中的意外现象
9、不可不记;五、实验设计的三个根本原那么重复重复提高精确性提高精确性统计推断统计推断降低误差降低误差无偏估计误差无偏估计误差估计误差估计误差局部控制局部控制随机化随机化 一、实验误差的来源 实验处理常常受到各种非处理因素的影响,使实验处理的效应不能真实地反映出来 , 也就是说 ,实验所得到的观测值,不但有处理的真实效应,而且还包含其它因素的影响,这就出现了实测值与真值的差异,这种差异在数值上的表现称为实验误差。 由于产生误差的原因和性质不同,实验误差可分为系统误差片面误差、随机误差抽样误差两类。 系统误差影响实验的准确性,随机误差影响实验的精确性。为了提高实验的准确性与精确性,即提高实验的正确性
10、,必须防止系统误差 ,降低随机误差 。为了 有效地防止系统误差 ,降低随机误差 ,必 须了解实验误差的来源。 1、实验材料固有的差异 是指各处理的供试个体在遗传和生长发育上或多或少的差异性。 2、环境条件的差异 主要指那些不易控制的环境的差异,如开放环境下的温度、湿度、光照、通风、地质不同所引起的差异等。 3 3、操作者的操作技术的差异、操作者的操作技术的差异 不不同同的的实实验验者者,或或同同一一个个实实验验者者在在不不同同的的时时间间、心心态、体能条件下,操作技术不同引起的差异。态、体能条件下,操作技术不同引起的差异。 4 4、由一些随机因素引起的偶然差异、由一些随机因素引起的偶然差异 如
11、偶然疾病的侵袭、饲料的不稳定等引起的差异。如偶然疾病的侵袭、饲料的不稳定等引起的差异。 针对误差的主要来源,应采取切实有效的措施,如尽量选择初始条件一致的实验动物,尽量做到饲养管理一致,认真细致进行观测记载等,力求防止系统误差,降低随机误差。 统计学上通过合理的实验设计既能获得实验处理效应与实验误差的无偏估计,也能控制和降低随机误差,提高实验的精确性。在实验设计时必须遵循以下根本原那么。 一重复 重复是指实验中同一处理实施在两个或两个以上的实验单位上。 在动物实验中,一头动物可以构成一个实验单位,有时一组动物也可构成一个实验单位。 设置重复的主要作用在于估计实验误差和降低实验误差 。如 果 同
12、一处理只实施在一个实验单位上,那么只能得到一个观测值,那么无从看出差异,因而无法估计实验误差的大小。只有当同一处理实施在两个或两个以上的实验单位上,获得两个或两个以上的观测值时,才能估计出实验误差。 样样 本本 标标 准误与标准差的关系是准误与标准差的关系是 即平均数抽样误差的大小与重复次数的平方根即平均数抽样误差的大小与重复次数的平方根成反比,故成反比,故重复次数多可以降低实验误差重复次数多可以降低实验误差。但在实。但在实际应用时,重复数太多,实验动物的初始条件不易际应用时,重复数太多,实验动物的初始条件不易控制一致,也不一定能降低误差。重复数的多少可控制一致,也不一定能降低误差。重复数的多
13、少可根据实验的要求和条件而定。如果供试动物个体间根据实验的要求和条件而定。如果供试动物个体间差异较大,重复数应多些;差异较大,重复数应多些; 差差 异异 较小,重复数可较小,重复数可少些。少些。 二随机化 随机化是指在某一处理或处理组合安排在哪一个实验个体上进行,必须使用随机的方法,使供试个体进入各实验组的时机相等,以防止实验人员主观倾向的影响。这是在实验中排除非实验因素干扰的重要手段,目的是为了获得无偏的误差估计量。 三局部控制三局部控制 实验条件的局部一致性实验条件的局部一致性 在在实实验验中中,当当实实验验环环境境或或实实验验单单位位差差异异较较大大时时,仅仅根根据据重重复复和和随随机机
14、化化两两原原那那么么进进行行设设计计不不能能将将实实验验环环境境或或 实实验验单单 位位 差差 异异 所所 引引 起起 的的变变异异从从实实验验误误差差中中别别离离出出来来,因因 而而 实实验验误误 差差 大大 ,实实验验的的 精精 确确 性性 与与 检检 验验的的灵灵敏敏度度低低。为为 解解 决决 这这 一一 问问 题题 ,在在 实实验验环环 境境 或或 实实验验单单位位差差异异大大的的 情情 况况 下下 ,可可 将将 整整 个个 实实验验环环 境境 或或 试试 验验 单单 位位 分分 成成 假假设设 干干 个个 小小 环环 境境 或或 小小 组组,在在 小小 环环 境境 或或小小组组内内使
15、使 非非 处处 理理 因因 素素 尽尽 量量 一一 致致 ,这这就就是是局局部部控控制制 。 每每 个个 比比 较较 一一 致致 的的 小小 环环 境境或或小小组组,称称为为单单位位组组或或区区组组。因因为为单单位位组组之之间间的的差差异异可可在在方方差差分分析析时时从从实实验验误误差差中中别别离离出来,所以局部控制能较好地降低实验误差。出来,所以局部控制能较好地降低实验误差。 重重复复、随随机机化化、局局部部控控制制称称为为费费雪雪三三原那么原那么,是实验设计中必须遵循的原那么。是实验设计中必须遵循的原那么。第二节第二节 简单实验设计简单实验设计 一、比照设计一、比照设计这种方法是,设定一系
16、列的标准实验区对照区,这种方法是,设定一系列的标准实验区对照区,CK,然后处理区的数据与与它位置相邻的,然后处理区的数据与与它位置相邻的 CK区进行比较,结果以百分数表示。区进行比较,结果以百分数表示。在田间实验时,一个在田间实验时,一个CK区可以与它前后各一个处区可以与它前后各一个处理区相邻。理区相邻。缺点:无法进行方差分析,一般认为与缺点:无法进行方差分析,一般认为与CK相差相差10%有差异;有差异;5%的认为也许有差异,需进的认为也许有差异,需进一步实验。一步实验。二、成组比较实验设计二、成组比较实验设计实验材料随机的分成两组,每组各进行一种处理。实验材料随机的分成两组,每组各进行一种处
17、理。往往其中一组就是做对照。往往其中一组就是做对照。三、配比照较实验设计配对的处理可以得到配对的数据。与成组设计相比,实验个体的差异受到了控制,因此实验误差得到了进一步的控制。三、完全随机分组的实验设计当处理水平在3个或3个以上时,将实验材料随机分到各个组,每个组对应一个处理。第三节 随机区组设计 为了控制实验误差,实验材料必须具备同质性。为了控制实验误差,实验材料必须具备同质性。如果一次实验需要的实验材料较多,要求实验材如果一次实验需要的实验材料较多,要求实验材料具备同质性就比较困难。为了解决这个问题,料具备同质性就比较困难。为了解决这个问题,可以将性质相同或接近的实验材料具有同质性可以将性
18、质相同或接近的实验材料具有同质性组成一个区组组成一个区组(block)。然后,区组内的各个实。然后,区组内的各个实验材料随机安排给各个处理水平。验材料随机安排给各个处理水平。随机区组设计一般都是指随机完全区组设计,随机区组设计一般都是指随机完全区组设计,“完全指的是,在任意一个区组内都包含所有的完全指的是,在任意一个区组内都包含所有的处理。一般进行实验设计时,在一个区组内,每处理。一般进行实验设计时,在一个区组内,每个处理出现一次。个处理出现一次。 优点:由于在数据处理上,是将“区组也作为一个处理因素区组间存在差异,因此,方差分析中,计算误差平方和SSe时,就将区组平方和SSr别离出去了。这种
19、方法比完全随机法要灵敏,误差也要小。缺点:因素的水平组合处理不能太多,不能超过20个,最好不要超过10个。否那么,区组内的实验个体数目需要太多,很难保证同质性。 一、单因素的随机区组设计结果的方差分析实际上,就是将“区组也作为一个因素,做两因素的方差分析,当然,不必考虑“区组“处理之间的交互作用。如果实验有k个处理,分n个区组,有以下关系:看作是A因素有k个水平,B因素有n个水平,无重复的两因素方差分析 n n【例【例10.110.1】有】有8 8个小麦品种,采用随机区组设计,个小麦品种,采用随机区组设计,分分3 3个区组,产量如下:个区组,产量如下:(kg/40m(kg/40m2 2) ),
20、试作方差分析。,试作方差分析。区组区组I I品种品种B BF FA AE EH HGGC CDD产量产量10.810.810.110.110.910.911.811.89.39.310.010.011.111.19.19.1区组区组IIII品种品种C CE EGGH HB BA ADDF F产量产量12.512.513.913.911.511.510.410.412.312.39.19.110.710.710.610.6区组区组IIIIII品种品种A AC CE EGGDDH HF FB B产量产量12.212.210.510.516.816.814.114.110.110.114.414.4
21、11.811.814.014.0n n1、将数据作一下整理,如表:区组区组I IIIIIIIIIIIT Tt t平均值平均值品种品种A AB BC CDDE EF FGGH H10.910.910.810.811.111.19.19.111.811.810.110.110.010.09.39.39.19.112.312.312.512.510.710.713.913.910.610.611.511.510.410.412.212.214.014.010.510.510.110.116.816.811.811.814.114.114.414.432.232.237.137.134.134.129
22、.929.942.542.532.532.535.635.634.134.110.710.712.412.411.411.410.010.014.214.210.810.811.911.911.411.4T Tr r83.183.191.091.0103.9103.9278.0278.0n n2、按以下公式计算平方和:n n3 3、作方差分析,如下表:、作方差分析,如下表:变异来源变异来源SSSSdfdfs s2 2F FF F0.050.05F F0.010.01品种间品种间区组间区组间误差误差34.0834.0827.5627.5622.9722.977 72 214144.874.871
23、3.7813.781.641.642.97*2.97*8.40*8.40*2.762.763.743.744.284.286.516.51总变异总变异84.6184.612323n n4 4、在品种间有显著差异,作多重比较、在品种间有显著差异,作多重比较SSRSSR法法如下:如下:dfdfe eMMSSRSSR0.050.05SSRSSR0.010.01LSRLSR0.050.05LSRLSR0.010.0114142 23.033.034.214.211.371.371.911.913 33.183.184.394.391.441.441.991.994 43.273.274.514.511
24、.481.482.042.045 53.333.334.594.591.511.512.082.086 63.373.374.654.651.531.532.112.117 73.403.404.704.701.541.542.132.138 83.433.434.744.741.551.552.152.15品种品种平均数平均数-D-D-A-A-F-F-H-H-C-C-G-G-B-BE E14.214.24.2*4.2*3.5*3.5*3.4*3.4*2.8*2.8*2.8*2.8* *2.3*2.3*1.8*1.8*B B12.412.42.4*2.4*1.7*1.7*1.6*1.6*1.0
25、1.01.01.00.50.5GG11.911.91.9*1.9*1.21.21.11.10.50.50.50.5C C11.411.41.41.40.70.70.60.60.00.0H H11.411.41.41.40.70.70.60.6F F10.810.80.80.80.10.1A A10.710.70.70.7DD10.010.0n n小麦品种小麦品种A A、C C、DD、F F、H H无显著差异;无显著差异;E E产量最高,产量最高,与与B B有显著差异,与其它品种有极显著差异;有显著差异,与其它品种有极显著差异;B B次次之,与之,与DD有极显著差异,与有极显著差异,与A A、F
26、 F有显著差异;再次,有显著差异;再次,那么是那么是GG,它与,它与DD有显著差异。有显著差异。二、两因素的随机区组设计结果的方差分析实验有A、B两因素,两因素有ab种处理水平组合,分r个区组,有以下关系: 【例【例10.210.2】探讨三种微肥对小麦的增产效应,采用两】探讨三种微肥对小麦的增产效应,采用两种施肥方式,作随机区组实验,分三个区组,同时以种施肥方式,作随机区组实验,分三个区组,同时以清水作对照,结果如下:清水作对照,结果如下:kg/kg/亩。试作方差分析。亩。试作方差分析。处理组合处理组合B1(B1(硫酸锌硫酸锌) )B2(B2(稀土稀土) )B3(B3(翠绿翠绿) )B4(B4
27、(清水清水) )A1(A1(拌种拌种) )A1B1A1B1A1B2A1B2A1B3A1B3A1B4A1B4A2(A2(喷施喷施) )A2B1A2B1A2B2A2B2A2B3A2B3A2B4A2B4区组区组I IIIIIIIIIII处理处理A1B1A1B1A2B1A2B1A1B2A1B2A2B2A2B2A1B3A1B3A2B3A2B3A1B4A1B4A2B4A2B4418.7418.7407.2407.2430.4430.4396.4396.4434.6434.6402.4402.4376.4376.4372.3372.3425.3425.3411.3411.3438.7438.7403.740
28、3.7440.1440.1405.3405.3381.2381.2378.6378.6416.7416.7408.3408.3428.4428.4398.3398.3436.7436.7403.2403.2378.3378.3376.7376.71 1、先将数据整理如下:、先将数据整理如下:区组区组I IIIIIIIIIIIT TABAB处理处理A1B1A1B1A2B1A2B1A1B2A1B2A2B2A2B2A1B3A1B3A2B3A2B3A1B4A1B4A2B4A2B4418.7418.7407.2407.2430.4430.4396.4396.4434.6434.6402.4402.437
29、6.4376.4372.3372.3425.3425.3411.3411.3438.7438.7403.7403.7440.1440.1405.3405.3381.2381.2378.6378.6416.7416.7408.3408.3428.4428.4398.3398.3436.7436.7403.2403.2378.3378.3376.7376.71260.71260.71226.81226.81297.51297.51198.41198.41311.41311.41210.91210.91135.91135.91127.61127.6TrTr3238.43238.4 3284.2328
30、4.2 3246.63246.6 9769.29769.22 2、然后将、然后将ABAB组合的组合的T TABAB按按A A、B B因素分拆为因素分拆为T TA A、T TB B,如,如下:下:处理组合处理组合B1(B1(硫酸锌硫酸锌) )B2(B2(稀土稀土) )B3(B3(翠绿翠绿) )B4(B4(清水清水) )T TA AA1(A1(拌种拌种) )1260.71260.71297.51297.51311.41311.41135.91135.95005.55005.5A2(A2(喷施喷施) )1226.81226.81198.41198.41210.91210.91127.61127.64
31、763.74763.7T TB B2487.52487.52495.92495.92522.32522.32263.52263.59769.29769.23 3、计算各项平方和,如下:、计算各项平方和,如下:n n4 4、作方差分析,如下表:、作方差分析,如下表:变异来源变异来源SSSSdfdfs s2 2F FF F0.050.05F F0.010.01A AB BABAB区组间区组间误差误差2436.142436.147214.247214.241087.051087.05149.11149.1141.2241.221 13 33 32 214142436.142436.142404.75
32、2404.75362.35362.3574.5674.562.942.94827.41*827.41*816.75*816.75*123.07*123.07*25.32*25.32*4.604.603.343.343.343.343.743.748.868.865.565.565.565.566.516.51总变异总变异10927.7610927.7623235 5、作多重比较、作多重比较课后自习课后自习注意:因为已经设定清水组为对照,在肥料品种间只要注意:因为已经设定清水组为对照,在肥料品种间只要与对照进行比较即可。与对照进行比较即可。上节的主要内容:目的:获得、比较平均值1、比照设计; 与
33、相邻的标准区块比照2、成组比较的实验设计; 实验个体随机安排到两个组中3、配比照较的实验设计; 成对的实验个体或一个个体进行两次实验得到一对实验数据目的:对实验处理效应进行比较4、完全随机分组的实验设计; 实验个体随机安排到某个组中,每组进行一个实验处理5、随机区组的实验设计; 将同质的实验个体分成一个区组,区组内的实验个体随机地安排进行一个实验处理,在区组内,所有要作的处理都进行、并且只进行一次,区组数=处理的重复数第四节 拉丁方设计随机区组设计,之所以比完全随机分组设计更精密,就因为它从误差平方和中别离出区组平方和,使得误差减小。随机区组设计要求在区组内部的条件是一致的,这在有些情况下很难
34、满足。比方,实验动物在年龄上有差异的同时,在体重上也有差异,很难在一个区组内凑够足够的实验动物。再比方,实验使用的田地,北方肥沃南部贫瘠,同时,东部肥沃而西部贫瘠,这样也很难划分区组。我们有一个改进的方法解决这个问题:设计一个两维的区组,在行的方向上解决一个差异问题,比方动物年龄、田地东西走向;在另一维,列的方向上解决另一个差异问题,比方动物体重、田地南北走向。这样的方法就是拉丁方设计。拉丁方Latin square名字来源于最初是用拉丁字母表示一个小区。拉丁方设计是从横行和直列两个方向进行双重局部控制,使得横行和直列两向皆成区组的设计。在拉丁方设计中,每一行或每一列都成为一个完全区组,而每一
35、处理在每一行或每一列都只出现一次,也就是说,在拉丁方设计中,实验处理数=横行区组数=直列区组数=实验处理的重复数。这是一个5阶的拉丁方的例子:A B C D EB C D E AC D E A BD E A B CE A B C D其中,ABCDE各字母在每一行、每一列都出现一次。这各例子中,第一行和第一列的字母是顺序排列的,又被称为标准拉丁方。 在对拉丁方设计实验结果进行统计分析时,由于能将横行、直列二个区组间的变异从实验误差中别离出来,因而拉丁方设计的实验误差比随机区组设计小,实验精确性比随机区组设计高。 在进行拉丁方设计时,可从上述多种拉丁方中随机选择一种;或选择一种标准型,随机改变其行
36、列顺序后再使用。常用拉丁方 拉丁方设计方法 下面结合具体例子说明拉丁方设计方法。 【例10.3】 为了研究5种不同温温度度对蛋鸡产蛋量的影响,将5栋鸡舍的温度设为A、B、C、D、E,把各栋鸡舍的鸡群的产蛋期分为5期,由于各鸡鸡群群和产产蛋蛋期期的不同对产蛋量有较大的影响,因此采用拉丁方设计,把鸡群和产蛋期作为区组设置,以便控制这两个方面的系统误差。 拉丁方设计步骤如下: 一选择拉丁方 选择拉丁方时应根据实验的处理数即横行、直列区组数先确定采用几阶拉丁方,再选择标准型拉丁方或非标准型拉丁方。 此例因实验因素为温度,处理数为5;将鸡群作为直列区组因素,直列区组数为5;将产蛋期作为横行区组因素,横行
37、区组数亦为5,即实验处理数、直列区组数、横行区组数均为5,那么应选取55阶拉丁方。本例选取前面列出的第2个5 5标准型拉丁方,即:A B C D EB A D E CC E B A DD C E B AE D A C B 二随机排列 在选定拉丁方之后,假设是非标准型,那么可直接由拉丁方中的字母获得实验设计。假设是标准型拉丁方,还应按以下要求对直列、横行和实验处理的顺序进行随机排列。 33标准型拉丁方: 直列随机排列,再将第二和第三横行随机排列。 44标准型拉丁方: 先随机选择4个标准型拉丁方中的一个;然 后 将 所 有的直列和第二、三、四横行随机排列,或 者 将 所 有的直列、横行随机排列;最
38、后将处理随机排列。 55标准型拉丁方:先随机选择4个标准型拉丁方中的一个;然后将所有的直列、横行及处理都随机排列。 下面对选定的55标准型拉丁方进行随机排列。先屡次从随机函数得到15的数,并组成3个5位数,如:13542,41523,34521。然后将上面选定的55拉丁方的直列、横行及处理按这3个五位数的顺序重新随机排列。 1、直列随机 将拉丁方的各直列顺序按13542顺序重排。 2、横行随机 再 将直列重排后的拉丁方的各横行按41523顺序重排。 选择拉丁方直列随机横行随机1234513542ABCDEBAECDCDBEADEABCECDABABCDECDBEAECDABDEABCBAECD
39、41523DAEBCECADBAEBCDBDCEACBDAE3、把5种不同温度与字母ABCDE对应。由表可以看出,第一鸡群在第个产蛋期用D温度,第二鸡群在第个产蛋期用A温度,等等。实验应严格按设计实施。三、实验结果的统计分析 拉丁方设计实验结果的分析,是 将两个区组因素与实验因素一起,按 三因素实验单独观测值的方差分析法进行,但应假定3个因素之间不存在交互作用。对拉丁方实验结果进行方差分析的数学模型为: i=j=k=1,2,r 式中: m 为总平均数; ai 为第i横行区组效应; 为第j直列区组效应, 为第k处理效应。 区组效应ai、 通常是随机的,处理效应 通常是固定的,且有 ; 为随机误差
40、,相互独立,且都服从N0,2。注意: k不是独立的下标,因为不是独立的下标,因为i、j一经确定,一经确定,k亦随之确定。亦随之确定。 平方和与自由度划分式为: SST = SS行+SS列+SSt+SSe dfT = df 行+ df列+ dft+dfe 例10.4】实验结果如表所示。整理的资料: 产产蛋期蛋期鸡鸡群群T行行一一二二三三四四五五IIIIIIIVVD(23)A(22)E(30)B(25)C(19)E(21)C(20)A(25)D(22)B(20)A(24)E(20)B(26)C(25)D(22)B(21)D(21)C(22)E(21)A(19)C(18)B(22)D(23)A(23
41、)E(19)108105116116104T列列109108119107106549温度温度ABCDETt平均平均值值11623.211422.810521.011322.610120.2进行方差分析: 1、计算各项平方和与自由度 矫正数矫正数 C C= =T T2 2/r /r2 2=549=5492 2/5/52 2=12056.04=12056.04 总平方和总平方和 SSSST T = = x x 2 2ij ij- -C C= =23232 2+21+212 2+ +19+192 2 -12056.04= 12157-12056.04-12056.04= 12157-12056.04
42、 =100.96 =100.96 横行平方和横行平方和 SSSS 行行 = = T T 2 2行行 / /r r- - C C = =(108(1082 2+105+1052 2+ +104+1042 2)/5-12056.04)/5-12056.04 =27.36 =27.36 直列平方和直列平方和 SSSS 列列 = = T T 2 2列列 / / r r C C = =(109(1092 2+108+1082 2+ +106+1062 2)/5-12056.04)/5-12056.04 =22.16 =22.16 处理平方和处理平方和 SSSSt t = = T T 2 2t t / /
43、 r r - - C C = =(116(1162 2+114+1142 2+ +101+1012 2)/5-12056.04)/5-12056.04 =33.36 =33.36总自由度 dfT= r 2-1=52-1=24横行自由度 df行行= r-1=5-1=4直列自由度 df列列= r-1=5-1=4误差平方和 SS e= SS T- SS 行行- SS 列列- SS t = = 18.08处理自由度 dft= r-1=5-1=4误差自由度 dfe=dfT-df行行-df列列-dft =(r-1)( r-2)=(5-1)(5-2)=12 2、列出方差分析表,进行F检验变变异来源异来源SS
44、dfs2FF0.05F0.01横行间直列间温度间误差27.3622.1633.3618.08444126.845.548.341.504.556*3.69*5.56*3.263.263.265.415.415.41总变总变异异100.9624 经F检验,产蛋期间和鸡群间差异显著,温度间差异极显著。因在拉丁方设计中,横行、直列区组因素是为了控制和降低实验误差而设置的非实验因素,即使显著一般也不对区组间进行多重比较。下面对不同温度平均产蛋量间作进行多重比较。 3、多重比较 标准误为: 由dfe=12和k=2,3,4,5从q值表查得临界q值:q0.05和q0.01,并与 相乘得 值,列于表。dfeM
45、q0.05q0.01LSR0.05LSR0.011223453.083.774.204.514.325.045.505.841.692.072.312.482.382.783.033.21列出多重比较表 多重比较结果说明:温度A、B、D平均产蛋量显著地高于E,其余之间差异不显著。温度温度-20.2-21.0-22.6-22.8ABDCE23.222.822.621.020.23.0*2.6*2.4*0.82.21.81.60.60.20.4拉丁方设计的优缺点 一拉丁方设计的主要优点 1、精确性高 拉丁方设计在不增加实验单位的情况下,比随机区组设计多设置了一个区组因素,能将横行和直列两个区组间的
46、变异从实验误差中别离出来,因而实验误差比随机区组设计小,实验的精确性比随机区组设计高。 2、实验结果的分析简便 二拉丁方设计的主要缺点 因为在拉丁设计中,横行区组数、直列区组数、实验处理数与实验处理的重复数必须相等,所以处理数受到一定限制。假设处理数少,那么重复数也少,估计实验误差的自由度就小,影响检验的灵敏度;假设处理数多,那么重复数也多,横行、直列区组数也多,导致实验工作量大,且同一区组内实验动物的初始条件亦难控制一致。因此,拉丁方设计一般用于5-8个处理的实验。在采用4个以下处理的拉丁方设计时,为了使估计误差的自由度不少于12,可采用“复拉丁方设计,即同一个拉丁方实验重复进行数次,并将实
47、验数据合并分析,以增加误差项的自由度。 应当注意,在进行拉丁方实验 时,某些区组因素,如奶牛的泌乳阶段,实验因素的各处理要逐个地在不同阶段实施,如果前一阶段有残效,在后一阶段的实验中,就会产生系统误差而影响实验的准确性。此时应根据实际情况,安排适当的实验间歇期以消除残效。另外,还要注意,横行、直列区组因素与实验因素间不存在交互作用 ,否 那么 不能采用拉丁方设计。 拉丁方设计重复实验次数的估计 假设要求dfe=(k-1) (k-2)12,那么重复数(此时等于处理数)5。 所以,为了使误差自由度不小于12 ,那么应进行处理数(即重复数)5的拉丁方实验,即进行55以上的拉丁方实验。当进行处理数为3
48、 、4的拉丁方实验时可将33拉丁方实验重复6次,44拉丁方实验重复2次,以保证dfe=12。 第五节 希腊-拉丁方设计拉丁方只适用于单因素的实验设计,横行效应、直列效应我们一般不感兴趣,这本来就是进行局部控制的依据。如果是两个因素的处理,可以先用拉丁字母设计一个拉丁方,再用希腊字母设计一个拉丁方,然后将它们组成一个由复合字母组成的希腊-拉丁方。当然,能够组成复合拉丁方的拉丁方是有些特别要求的。A B C a b gB C A g a bC A B b g aAa Bb CgBg Ca AbCb Ag Ba在新的拉丁方中,复合字母Aa、Bg等只出现一次,而单个字母A、B、C、a、b、g却出现了3
49、次。希腊-拉丁方的概念可以进一步扩展,pp阶的拉丁方可以有p-1个进行重叠。这些可以重叠的拉丁方必须是互为正交的,p329附表12有12阶以下的正交拉丁方的完全系。6阶的无正交拉丁方同样的,希腊-拉丁方仍然不能处理行、列、拉丁字母、希腊字母之间的交互作用。第六节 裂区设计(选讲选讲)拉丁方设计是由随机区组设计方法由一维向二维扩展变化出来的。随机区组设计法还可以有其它的变化。【例10.7】用3种方法从植物中提取有效成分,按4种浓度添加到培养基中,观察提取物对真菌生长的抑制作用。第七节第七节 正交设计正交设计Aa Bb CgBg Ca AbCb Ag Ba B1 B2 B3A1A2A3C1D1 C
50、2D2 C3D3C2D3 C3D1 C1D2C3D2 C1D3 C2D1把A、B、C、D各因素的下标即各因素的各个处理水平列成一个表:因素因素因素因素AABBC CDD1 12 23 34 45 56 67 78 89 91 11 11 12 22 22 23 33 33 31 12 23 31 12 23 31 12 23 31 12 23 32 23 31 13 31 12 21 12 23 33 31 12 22 23 31 1 在实验研究中,对于单因素或两因素实验,因其在实验研究中,对于单因素或两因素实验,因其因素少因素少 ,实验的设计,实验的设计 、实施与分析都比较简单、实施与分析都
51、比较简单 。但。但在实际工作中在实际工作中 ,常常需要同时考察,常常需要同时考察 3 3个或个或3 3个以上的个以上的实验因素实验因素 ,假设进行全面实验,假设进行全面实验 ,那么实验的规模将,那么实验的规模将很大很大 ,往往因实验条件的限制而难于实施,往往因实验条件的限制而难于实施 。正。正 交设交设计就是安排多因素实验计就是安排多因素实验 、寻求最优水平组合、寻求最优水平组合 的一种的一种高效率实验设计方法。高效率实验设计方法。 一、正交设计的概念及原理 (一) 正交设计的根本概念 正交设计是利用正交表来安排与分析多因素实验的一种设计方法。它利用从实验的全部水平组合中,挑选局部有代表性的水
52、平组合进行实验,通过对这局部实验结果的分析了解全面实验的情况,找出最优的水平组合。 例如,影响某品种鸡的生产性能有例如,影响某品种鸡的生产性能有3 3个因素:个因素: A A因素是饲料配方,设因素是饲料配方,设A1A1、A2A2、A3 3A3 3个水平;个水平;B B因因素是光照,设素是光照,设B1B1、B2B2、B3 3B3 3个水平;个水平;C C因素是温度,因素是温度,设设C1C1、C2C2、C3 3C3 3个水平。这是一个个水平。这是一个3 3因素因素3 3水平的实验水平的实验 ,各因素的水平之间全部可能的组合有,各因素的水平之间全部可能的组合有2727种种 。 如果实验方案包含各因素
53、的全部水平组合如果实验方案包含各因素的全部水平组合 ,即进,即进行全面实验,可以分析各因素的效应行全面实验,可以分析各因素的效应 ,交互作用,也,交互作用,也可选出最优水平组合。这是全面实验的优点可选出最优水平组合。这是全面实验的优点 。但全面。但全面实验包含的水平组合数较多,工作量大实验包含的水平组合数较多,工作量大 ,由于受实验,由于受实验场地、实验个体、经费等限制而难于实施场地、实验个体、经费等限制而难于实施 。 假设实验的主要目的是假设实验的主要目的是 寻寻 求求 最最 优水平组合优水平组合 ,那,那么么 可利用正交可利用正交 设设 计来安排实验。计来安排实验。 正交设计的根本特点是:
54、用局部实验来代替全面实验,通过对局部实验结果的分析,了解全面实验的情况。 正因为正交实验是用局部实验来代替全面实验,它 不 可 能像全面实验那样对各因素效应、交互作用一一分析;当交互作用存在时,有可能出现交互作用的混杂。虽然正交设计有上述缺乏,但它能通过局部实验找到最优水平组合 ,因 而 很 受实际工作者青睐。 如对于上述3因素3水平实验,假设不考虑交互作用,可利用正交表L9(34)安排,实验方案仅包含9个水平组合,就能反映实验方案包含27个水平组合的全面实验的情况,找出最正确的生产条件。 (二) 正交设计的根本原理 在实验安排中 ,每个因素在研究的范围内选几个水平,就好比在选优区内打上网格
55、,如果网上的每个点都做实验,就是全面实验。如上例中,3个因素的选优区可以用一个立方体表示,3个因素各取 3个水平,把立方体划分成27个格点,反映在 图上就是立方体内的27个“.。假设27个网格点都实验,就是全面实验。 3 3 因因 素素 3 3 水水 平平 的的 全全 面实验水平组合数为面实验水平组合数为3 33 3=27=27,4 4 因因素素3 3水平的全面实验水平组合数为水平的全面实验水平组合数为3 34 4=81 =81 ,5 5因素因素3 3水平水平的全面实验水平组合数为的全面实验水平组合数为3 35 5=243=243,这在实验中是不太,这在实验中是不太可能做到的。可能做到的。 正
56、交设计就是从选优区全面实验点水平组合中挑选出有代表性的局部实验点水平组合来进行实验。图中标有实验号的九个“(),就是利用正交表L9(34)从27个实验点中挑选出来的9个实验点。即:(1)A1B1C1 (2)A2B1C2 (3)A3B1C3(4)A1B2C2 (5)A2B2C3 (6)A3B2C1(7)A1B3C3 (8)A2B3C1 (9)A3B3C2 上述选择 ,保证了A因素的每个水平与B因素、C因素的各个水平在实验中各搭配一次。对于A、B、C 3个因素来说 , 是在27个全面实验点中选择9个实验点 ,仅 是全面实验的 三分之一。从图中可以看到,9个实验点在选优区中分布是均衡的,在立方体的每
57、个平面上 ,都恰是3个实验点;在立方体的每条线上也恰有一个实验点。9个实验点均衡地分布于整个立方体内 ,有很强的代表性 ,能够比较全面地反映选优区内的根本情况。 二、正交表及其特性 (一) 正交表 由于正交设计安排实验和分析实验结果都要 用 正交表,因此,我们先对正交表作一介绍。 p271/p330表是一张正交表,记号为L8(27),其中“L代表正交表;L右下角的数字“8表示有8行 ,用这张正交表安排实验包含8个处理(水平组合) ;括号内的底数“2 表示因素的水平数,括号内2的指数“7表示有7列 ,用这张正交表最多可以安排7个2水平因素。(8对应正交实验要进行的实验次数,27对应完全实验要进行
58、的实验次数 常用的正交表已由数学工作者制定出来,供进行正交设计时选用。2水平正交表除L8(27)外,还有L4(23)、L16(215)等;3水平正交表有L9(34)、L27(213)等详见附表9/附表13。 (二) 正交表的特性 任何一张正交表都有如下两个特性: 1、任一列中,不同数字出现的次数相等 例如L8(27)中不同数字只有1和2,它们各出现4次;L9(34)中不同数字有1、2和3,它们各出现3次 。 2、任两列中,同一横行所组成的数字对出现的次数相等 例如 L8(27)中(1, 1), (1, 2), (2, 1), (2, 2)各出现两次;L9(34) 中 (1, 1), (1, 2
59、), (1, 3), (2, 1), (2, 2), (2, 3), (3, 1), (3, 2), (3, 3)各出现1次。即每个因素的一个水平与另一因素的各个水平互碰次数相等,说明任意两列各个数字之间的搭配是均匀的。 根据以上两个特性,我们用正交表安排的实验,具有均衡分散和整齐可比的特点。 所谓均衡分散,是指用正交表挑选出来的各因素水平组合在全部水平组合中的分布是均匀的 。 由 图可以看出,在立方体中 ,任一平面内都包含 3 个“(), 任一直线上都包含1个“() ,因此 ,这些点代表性强 ,能够较好地反映全面实验的情况。 整齐可比是指 每 一个因素的各水平间 具 有可 比性。因为正交表中
60、每一因素的任一水平下都均衡地包含着另外因素的各个水平 ,当比较某因素不 同 水平时,其它 因素 的 效 应都彼此抵消。如在A、B、C 3个因素中,A因素的3个水平 A1、A2、A3 条件下各有 B、C 的 3 个不同水平,即: 在这9个水平组合中,A因素各水平下包括了B、C因素的3个水平,虽然搭配方式不同,但B、C皆处于同等地位,当比较A因素不同水平时,B因素不同水平的效应相互抵消,C因素不同水平的效应也相互抵消。所以A因素3个水平间具有可比性。同样,B、C因素3个水平间亦具有可比性。A1B1C1B2C2B3C3A2B1C2B2C3B3C1A3B1C3B2C1B3C2 (三) 正交表的类别 1
61、、相同水平正交表 各列中出现的最大数字相同的正交表称为相同水平正交表。如L4(23)、L8(27)、L12(211)等各列中最大数字为2,称为两水平正交表;L9(34)、L27(313)等各列中最大数字为3,称为3水平正交表。 2、混合水平正交表 各列中出现的最大数字不完全相同的正交表称为混合水平正交表。如L8(424)表中有一列最大数字为4,有4列最大数字为2。也就是说该表可以安排一个4水平因 素 和 4个 2水 平 因 素 。 再 如 L16(4423),L16(4212)等都混合水平正交表。三、正交设计方法三、正交设计方法 【例【例10.810.8】 在进行矿物质元素对架子猪补饲实在进行
62、矿物质元素对架子猪补饲实验中,考察补饲配方、用量、食盐验中,考察补饲配方、用量、食盐3 3个因素,每个个因素,每个因素都有因素都有3 3个水平。试安排一个正交实验方案。个水平。试安排一个正交实验方案。 正交设计一般有以下几个步骤:正交设计一般有以下几个步骤: ( (一一) ) 确定因素和水平确定因素和水平 影响实验结果的因素很多,我们不可能把所有影响实验结果的因素很多,我们不可能把所有影响因素通过一次实验都予以研究,只能根据以往影响因素通过一次实验都予以研究,只能根据以往的经验,挑选和确定假设干对实验指标影响最大、的经验,挑选和确定假设干对实验指标影响最大、有较大经济意义而又了解不够清楚的因素
63、来研究。有较大经济意义而又了解不够清楚的因素来研究。同时还应根据实际经验和专业知识,定出各因素适同时还应根据实际经验和专业知识,定出各因素适宜的水平,列出因素水平表。【例宜的水平,列出因素水平表。【例8.78.7】的因素水平】的因素水平表如表所示。表如表所示。 处理水平因素矿物质配方A用量(g)B食盐(g)C123IIIIII152520048 (二) 选用适宜的正交表 确定了因素及其水平后,根据因素、水平及需要考察的交互作用的多少来选择适宜的正交表。选用正交表的原那么是:既要能安排下实验的全部因素,又要使局部水平组合数处理数尽可能地少。一般情况下,实验因素的水平数应恰好等于正交表记号中括号内
64、的底数;因素的个数包括交互作用应不大于正交表记号中括号内的指数;各因素及交互作用的自由度之和要小于所选正交表的总自由度,以便估计实验误差。假设各因素及交互作用的自由度之和等于所选正交表总自由度,那么可采用有重复正交实验来估计实验误差。 此例有3个3水平因素,假设不考察交互作用,那么各因素自由度之和为因素数个数(水平数-1)=3(3-1)=6,小于L9(34)总自由度9-1=8,故可以选用L9(34);假设要考察交互作用,那么应选用L27(313),此时所安排的实验方案实际上是全面实验方案。 (三) 表头设计 所谓表头设计,就是把挑选出的因素和要考察的交互作用分别排入正交表的表头适当的列上。 在
65、不考察交互作用时,各因素可随机安排在各列上;假设考察交互作用,就应按该正交表的交互作用列表安排 各 因 素与交互作用。 此例不考察交互作用,可将矿物质元素补饲配方(A)、用量(B)和食盐 (C)依次安排在L9(34)的第1、2、3列上,第 4 列 为空列,见表。 (四) 列出实验方案 把正交表中安排各因素的每个列(不包含欲考察的交互作用列)中的每个数字依次换成该因素的实际水平,就得到一个正交实验方案。表头设计列号1234因素ABC空 根据上表,根据上表,1 1 号实验处理是号实验处理是 A A1 1B B1 1C C1 1,即配,即配 方方I I、用、用量量15g15g、食盐为、食盐为0 0;
66、2 2号实验处理是号实验处理是A A1 1B B2 2C C2 2,即配方,即配方II II 、 用用 量量 25g 25g 、食、食 盐盐 为为 4g 4g, ;9 9号实验处理为号实验处理为A A3 3B B3 3C C2 2,即配方,即配方IIIIII、用量、用量20g20g、食盐、食盐4g4g。 正交实验方案实验号因素ABC1234567891(I)1(I)1(I)2(II)2(II)2(II)3(III)3(III)3(III)1(15)2(25)3(20)1(15)2(25)3(20)1(15)2(25)3(20)1(0)2(4)3(8)2(4)3(8)1(0)3(8)1(0)2(
67、4)四、正交实验结果的统计分析 假设各号实验处理都只有一个观测值,那么称之为单独观测值正交实验;假设各号实验处理都有两个或两个以上观测值,那么称之为有重复观测值正交实验。 下面分别介绍单独观测值和有重复观测正交实验结果的方差分析。 (一) 单独观测值正交实验结果的方差分析 用L9(34)安排实验方案后,各号实验只进行一次,实验结果(增重)列于下表。试对其进行方差分析。 该次实验的9个观测值总变异由A因素、B因素、C因素及误差变异四局部组成,因而进行方差分析时平方和与自由度的划分式为: SST = SSA+SSB+SSC+SSe dfT = dfA + dfB + dfC + dfe 实验实验号
68、号因素因素增重增重(kg)xABC12345678911122233312312312312323131263.468.964.964.370.265.871.469.573.7T1T2T3197.2200.3214.6199.1208.6204.4198.7206.9206.5平均平均值值 表中,Ti为各因素同一水平实验指标增重之和。 如 A因素第1水平 T1=x1+x2+x3=63.4+68.9+64.9=197.2, A因素第2水平 T2=x4+x5+x6=64.3+70.2+65.8=200.3, A因素第3水平 T3=x7+x8+x9=71.4+69.5+73.7=214.6;B B
69、因素第因素第1 1水平水平 T T1 1= =x x1 1+x+x4 4+x+x7 7=63.4+64.3+71.4=199.1=63.4+64.3+71.4=199.1,B B因素第因素第3 3水平水平T T3 3= =x x3 3+x+x6 6+x+x9 9=64.9+65.8+73.7=204.4=64.9+65.8+73.7=204.4。同理可求得同理可求得C C因素各水平实验指标之和。因素各水平实验指标之和。 为各因素同一水平实验指标的平均数。 如A因素第1水平 =197.2/3=65.7333, A因素第2水平 =200.3/3=66.7667, A因素第3水平 =214.6/3=
70、71.5333。 同理可求得B、C因素各水平实验指标的平均数。 1、计算各项平方和与自由度 矫正数 C = T2/n = 612.12/9 = 41629.6011 总平方和 =63.42+68.92+73.72 - 41629.6011 =101.2489 A因素平方和 =(197.22+200.32+214.62)/3 41629.6011=57.4289 B因素平方和 =(199.12+208.62+204.42)/3 -41629.6011 =15.1089 C因素平方和 =(198.72+206.92+206.52)/3 误差平方和 SSe=SST-SSA-SSB-SSC =101.
71、2489-57.4289-15.1089 -41629.6011 =14.248914.2489 =14.4622 总自由度总自由度 dfdfT T = =n-1n-1=9-1=8=9-1=8 A A因素自由度因素自由度 dfdfA A = =k ka a-1-1=3-1=2=3-1=2 B B因素自由度因素自由度 dfdfB B = =k kb b-1-1=3-1=2=3-1=2 C C因素自由度因素自由度 dfdfC C = =k kc c-1-1=3-1=2=3-1=2 误差自由度误差自由度 dfdfe e = = dfdfT T-df-dfA A-df-dfB B-df-dfC C =
72、 8-2-2-2 = 2= 8-2-2-2 = 2 2、列出方差分析表,进行F检验变异来源SSdfs2FF0.05,2,2配方(A)用量(B)食盐(C)误差57.4315.1114.2514.46222228.717.557.127.233.971.05119.00总变异101.258 F 检验结果说明,三个因素对增重的影响都不显著。究其原因可能是本例实验误差大且误差自由度小(仅为2),使检验的灵敏度低,从而掩盖了考察因素的显著性。由于各因素对增重影响都不显著,不必再进行各因素水平间的多重比较。此时,可直观地从表中选择平均数大的水平A3、B3、C2组合成最优水平组合A3B3C2。 上述无重复正
73、交实验结果的方差分析,其误差是由“空列来估计的。然而“空列并不空,实际上是被未考察的交互作用所占据。这种误差既包含实验误差,也包含交互作用,称为模型误差。假设交互作用不存在,用模型误差估计实验误差是可行的;假设因素间存在交互作用,那么模型误差会夸大实验误差,有可能掩盖考察因素的显著性。这时,实验误差应通过重复实验值来估计。所以,进行正交实验最好能有二次以上的重复。正交实验的重复,可采用完全随机或随机区组设计。 (二) 有重复观测值正交实验结果的方差分析 【例例10.910.9】实实验验重重复复了了两两次次,且且重重复复采采用用随随机机区区组组设计,实验结果列于表。试对其进行方差分析。设计,实验
74、结果列于表。试对其进行方差分析。 用用n n表表示示实实验验( (处处理理) )号号数数,r r表表示示实实验验处处理理的的重重复复数数。a a、b b、c c、k ka a、k kb b、k kc c的的意意义义同同上上。此此例例n=9n=9、r=2r=2、a=b=c=3a=b=c=3、k ka a=k=kb b=d=dc c=3=3。实验实验号号因素因素增重增重(kg)xABC空空区区组组1区区组组2Tt1234567891112223312312312312323131212331223163.468.964.964.370.265.871.469.573.767.487.266.386
75、.388.566.689.091.292.8130.8156.1131.2150.6158.7132.4160.4160.7166.5T1T2T3418.1441.7487.6441.8475.5430.1423.9473.2450.3456.0448.9442.5Tr1347.4612.1735.3平均平均值值 对于有重复、且重复采用随机区组设计的正交实验,总变异可以划分为处理间、区组间和误差变异三局部,而处理间变异可进一步划分为A因素、B因素、C因素与模型误差变异四局部。此时,平方和与自由度划分式为: SST=SSt+SSr+SSe2 dfT = dft + dfr + dfe2 而 SS
76、t=SSA+SSB+SSC+SSe1 dft = dfA + dfB + dfC + dfe1 于是 SST=SSA+SSB+SSC+SSr+SSe1+SSe2 dfT = dfA + dfB + dfC + dfr + dfe1 + dfe2 式中:SSr为区组间平方和;SSe1为模型误差平方和;SSe2为实验误差平方和;SSt为处理间平方和;dfr、dfe1、dfe2 、dft为相应自由度。 注意,对于重复采用完全随机设计的正交实验,在平方和与自由度划分式中无SSr、dfr项。 1、计算各项平方和与自由度 矫正数 C =T2/ rn = 1347.42/29 =100860.3756 总平
77、方和 =63.42+68.92+92.82 - 100860.3756 =1978.5444 区组间平方和 =(612.12+735.32)/9 - 100860.3756 =843.2355 处理间平方和处理间平方和 = (130.8 = (130.82 2+156.1+156.12 2+166.5+166.52 2)/2 -100860.3756)/2 -100860.3756 = 819.6244 = 819.6244 A A因素平方和因素平方和 = (418.1 = (418.12 2+441.7+441.72 2+487.6+487.62 2)/32 -100860.3756)/32
78、 -100860.3756 = 416.3344 = 416.3344 B B因素平方和因素平方和 =(411.8=(411.82 2+475.5+475.52 2+430.1+430.12 2)/32 -100860.3756)/32 -100860.3756 =185.2077 =185.2077C C因素平方和因素平方和 = (423.9 = (423.92 2+473.2+473.22 2+450.3+450.32 2)/32 -100860.3756)/32 -100860.3756 = 202.8811 = 202.8811 模型误差平方和模型误差平方和 SSe1 = SSt SS
79、A SSB - SSC SSe1 = SSt SSA SSB - SSC =819.6244-416.3344-185.2077 -202.8811 =819.6244-416.3344-185.2077 -202.8811 =15.2021 =15.2021实验误差平方和实验误差平方和 SSe2 =SST SSr - SSt SSe2 =SST SSr - SSt =1978.5444-843.2355 - 819.6244 =1978.5444-843.2355 - 819.6244 =315.6845 =315.6845 总自由度 dfT=rn-1=29-1=17 区组自由度 dfr=r
80、-1=2-1=1 处理自由度 dft=n-1=9-1=8 A因素自由度 dfA=ka-1=3-1=2 B因素自由度 dfB=kb-1=3-1=2 C因素自由度 dfC=kc-1=3-1=2 模型误差自由度 dfe1= dft-dfA-dfB-dfC = 8-2-2-2-2 = 2 实验误差自由度 dfe2=dfT-dft =17-1-8 = 8 2、列出方差分析表,进行F检验变异来源SSdfs2FF0.05F0.01ABC区组间e1e2合并误差416.33185.21202.88843.2415.20315.68330.8822212810208.1792.60101.44843.247.60
81、39.4633.096.29*2.803.0725.48*14.104.104.104.967.557.557.5510.01总变异1978.5417 首先检验 与 差异的显著性,假设经F检验不显著,那么可将其平方和与自由度分别合并,计算出合并的误差方差,进行F检验与多重比较,以提高分析的精度;假设F检验显著,说明存在交互作用,二者不能合并,此时只能以 进行F检验与多重比较。本例 ,差异不显著,故将误差平方和与自由度分别合并计算出合并的误差方差 ,即 = (15.2021+315.6845)/(2+8) = 33.09 并用合并的误差方差 进行F检验与多重比较。 F检验结果说明,矿物质元素配方
82、对架子猪增得有显著影响,另外两个因素作用不显著;二个区组间差异极显著。 3、 A因素各水平平均数的多重比较 A因素各水平平均数多重比较表 (SSR法) 单位:kg其余步骤省略 多重比较结果说明:A因素A3水平的平均数显著或极显著地高于A2、A1;A2与A1间差异不显著。 此例因模型误差不显著,可以认为因素间不存在显此例因模型误差不显著,可以认为因素间不存在显著的交互作用。可由著的交互作用。可由A A、B B、C C因素的最优水平组合成最因素的最优水平组合成最优水平组合。优水平组合。A A因素的最优水平为因素的最优水平为A3A3;因为;因为B B、C C因素因素水平间差异均不显著,故可任选一水平
83、。如水平间差异均不显著,故可任选一水平。如B B、C C因素因素选择使增重达较高水平的选择使增重达较高水平的B2B2及及C2C2,那么得最优水平组,那么得最优水平组合为合为A3B2C2A3B2C2,即配方,即配方IIIIII、用量、用量2525克、食盐克、食盐4 4克。克。 假设模型误差显著,说明因素间交互作用显著,那假设模型误差显著,说明因素间交互作用显著,那么应进一步实验,以分析因素间的交互作用。么应进一步实验,以分析因素间的交互作用。 五、因素间有交互作用的正交设计与分析 在实际研究中,有时实验因素之间存在交互作用。对于既考察因素主效应又考察因素间交互作用的正交设计,除表头设计和结果分析
84、与前面介绍略有不同外,其它根本相同。 【例10.10】 某一种生产抗菌素的发酵培养基由A、B、C 3种成分组成,各有两个水平,除考察A、B、C三个因素的主效外,还考察A与B、B与C的交互作用。试安排一个正交实验方案并进行结果分析。 (一) 选用正交表,作表头设计 由于本实验有3个两水平的因素和两个交互作用需要考察,各项自由度之和为:3(2-1)+2(2-1)(2-1)=5,因此可选用L8(27)来安排实验方案。 正交表L8(27)中有根本列和交互列之分,根本列就是各因素所占的列,交互列那么为两因素交互作用所占的列。可利用L8(27)二列间交互作用列表来安排各因素和交互作用。 二列二列间间的交互
85、作用的交互作用列号列号1234567123456(1)3(2)21(3)567(4)4761(5)74523(6)654321 如果将A因素放在第1列 ,B 因素 放在第2列,查表可知,第1列与第2列的交互作用列是第3列,于是将A与B的交互作用 AB放在第3列。这样第3列不能再安排其它因素 ,以免出现“混杂。然后将C放在第4列, 查表 可知,BC应放在第6列,余以下为空列 ,如此可得表头设计,见表。 (二) 列出实验方案 根据表头设计,将A、B、C各列对应的数字“1、“2换成各因素的具体水平,得出实验方案列于表。表表头设计头设计列号列号1234567因素因素ABABC空空BC空空实验号因素结果
86、(%)xABABCBC123456781111222211221122112222111212121212211221553897891221247961T1T2279386339326233326353312327338665平均值69.7596.5084.7581.5088.2578.00 ( (三三) ) 结结果果分分析析 按按实实验验方方案案进进行行实实验验,其其结结果果见见下下表。表。 表表中中TiTi、 计计算算方方法法同同前前。此此例例为为单单独独观观测测值值正正交交实实验验,总总变变异异划划分分为为A A因因素素、B B因因素素、C C因因素素、ABAB、BCBC、与误差变异、
87、与误差变异5 5局部,平方和与自由度划分式为:局部,平方和与自由度划分式为: SST=SSA+SSB+SSC+SSAB+SSBC+SSe SST=SSA+SSB+SSC+SSAB+SSBC+SSe dfT = dfA + dfB + dfC +dfAB + dfBC + dfe dfT = dfA + dfB + dfC +dfAB + dfBC + dfe 1 1、计算各项平方和与自由度计算各项平方和与自由度 矫正数矫正数 C=TC=T2 2/n/n=665=6652 2/8=55278.1250/8=55278.1250总平方和总平方和 SSSST T= = x x2 2-C-C =55=
88、552 2+38+382 2+61+612 2 -55278.1250-55278.1250=6742.8750=6742.8750A A因素平方和因素平方和 SSSSA A= = T T2 2A A/a-C/a-C=(279=(2792 2+386+3862 2)/4)/4 -55278.1250=1431.1250 -55278.1250=1431.1250 B B因素平方和因素平方和 SSSSB B=T T2 2B B/b-C/b-C =(339 =(3392 2+326+3262 2)/4-55278.1250)/4-55278.1250 =21.1250 =21.1250 C C因素
89、平方和因素平方和 SS SSC C=T T2 2C C/c-C/c-C =(353 =(3532 2+312+3122 2)/4-55278.1250)/4-55278.1250 =210.1250 =210.1250 AB AB平方和平方和 SSSSABAB=T T2 2ABAB/4-C/4-C =(233 =(2332 2+432+4322 2)/4 -55278.1250)/4 -55278.1250 =4950.1250 =4950.1250 BC平方和 SSBC =T2BC /4 - C = (3272+3382)/4 - 55278.1250 = 15.1250 误差平方和 SSe
90、 = SST-SSA-SSB-SSAB-SSBC =115.2500 总自由度 dfT=n-1=8-1=7各因素自由度 dfA=dfB=dfC=2-1=1交互作用自由度 dfAB=dfBC =(2-1)(2-1)=1误差自由度 dfe=dfT-dfA-dfC-dfAB -dfBC =7-1-1-1-1-1 =22、列出方差分析表,进行F检验 变异来源SSdfs2FF0.05F0.01ABCABBC误差1431.12521.125210.1254950.12515.125115.1251111121431.12521.125210.1254950.12515.12557.62524.84*13.
91、6585.90*118.5118.5118.5118.5198.4998.4998.4998.49总变异6742.8457 F检验结果说明:A因素和交互作用AB显著,B、C因素及BC交互作用不显著。因交互作用AB显著,应对A与B的水平组合进行多重比较,以选出A与B的最优水平组合。 3、A与B各水平组合的多重比较 先计算出A与B各水平组合的平均数: A1B1水平组合的平均数=(55+38)/2=46.50 A1B2水平组合的平均数=(97+89)/2=93.00 A2B1水平组合的平均数=(122+124)/2=123.00 A2B2水平组合的平均数=(79+61)/2=70.00 q值与LSR
92、值:A、B因素各水平组合平均数多重比较表:dfedfeMMq q0.050.05q q0.010.01LSRLSR0.050.05LSRLSR0.010.012 22 23 34 46.096.098.278.279.809.8014.014.019.019.022.322.332.7032.7044.4644.4652.6352.6375.1875.18102.03102.03119.75119.75水平组合水平组合-46.5-46.5-70.0-70.0-93.0-93.0A2B1A2B1A1B2A1B2A2B2A2B2A1B1A1B1123.0123.093.093.070.070.04
93、6.546.576.5*76.5*46.5*46.5*23.523.553.0*53.0*23.023.030.030.0 多重比较结果说明,A2B1显著优于A2B2,A1B1;A1B2显著优于A1B1,其余差异不显著。最优水平组合为A2B1。 从以上分析可知,A因素取A2,B因素取B1,假设C因素取C1,那么本次实验结果的最优水平组合为A2B1C1。 注意,此例因dfe=2,F检验与多重比较的灵敏度低。为了提高检验的灵敏度,可将F1的 SSB、 dfB, SSBC、 dfBC合 并 到SSe、dfe中,得合并的误差方差,再用合并误差方差进行F检验与多重比较。(略)第八节第八节Plackett
94、-Burman优化法优化法(选讲选讲)生物实验中,有时需要处理的因素极多,如培养基的组分,可能有几十种,并且,由于我们事先不知道组分之间是否有交互作用,这样,即使用正交设计法,也无法同时处理如此多的因素。有一个变通的方法,先将一局部因素固定,用正交设计处理其它因素。如此重复,作多个正交设计。这种方法加大了工作量。另外一种方法:先想方法确认对实验产生大影响的因素,然后将其它因素固定,再作正交设计。Plackett-Burman法可以可以从众多的处理因素中快速的筛选出几个重要的因素。Plackett-Burman法,需进行n次实验,最多筛选n-1个处理因素,每个因素只能有两个处理水平,用、表示,比
95、方浓度高/低,组分有/无。其中,n=8,12,16,20,24,.以8实验6因素为例:实验号随机号因素ABC(D)EF(G)13+-+-28+-+-+35+-+-+41-+-+52+-+-66-+-+74-+-+-87-这个表有个特点:1、是个n(n-1)的表;2、每行的/号是上一行进行循环移位得到;3、最后一行全是“;4、每一列都有4个“和4个“;5、(D)(G)带括号的因素是虚拟因素,用于处理实验误差,可以选表中任一列。实验数据处理:1、各因素的效应:2、误差效应:3、标准误:4、t-检验:5、相对显著性:=1-a,表示成百分数,a由t值反查概率得到,df=dummy项数。6、因素筛选:一般而言,可以认为相对显著性80的因素是有重要影响的因素,这个条件也可以放宽到60。第一行的/号:N=8 :N=12:N=16:N=20: N=24: N=32: