《第五章回归设计课件》由会员分享,可在线阅读,更多相关《第五章回归设计课件(78页珍藏版)》请在金锄头文库上搜索。
1、5.1 5.1 回归设计的基本概念回归设计的基本概念5.2 Box5.2 BoxBenhkenBenhken设计设计5.3 5.3 二次回归的中心组合设计二次回归的中心组合设计5.4 5.4 二次回归正交设计二次回归正交设计5.5 5.5 二次回归旋转设计二次回归旋转设计5.6 D5.6 D最优混合设计最优混合设计第五章第五章 回归设计回归设计5.1 回归设计的基本概念回归设计的基本概念 回归设计方法是由英国统计学家回归设计方法是由英国统计学家G.BoxG.Box在在2020世世纪纪5050年代初针对化工生产提出的。年代初针对化工生产提出的。 回归设计也称为响应面设计,目的是寻求试回归设计也称
2、为响应面设计,目的是寻求试验指标与各定量因子间的定量规律,找到工作验指标与各定量因子间的定量规律,找到工作条件的最优值(最优工艺、最佳配方等)。条件的最优值(最优工艺、最佳配方等)。 它是在多元线性回归的基础上用主动收集数它是在多元线性回归的基础上用主动收集数据的方法获得具有较好性质的回归方程的一种据的方法获得具有较好性质的回归方程的一种试验设计方法。试验设计方法。 5.1.1 回归分析回归分析数据处理由被动变主动数据处理由被动变主动 古典的回归分析方法只是被动地处理已有的试验数据,古典的回归分析方法只是被动地处理已有的试验数据,对试验点的安排不提任何要求,试验点散乱而不均匀,预对试验点的安排
3、不提任何要求,试验点散乱而不均匀,预测值的标准误很大,且对于回归方程的精度研究也很少。测值的标准误很大,且对于回归方程的精度研究也很少。 其后果:其后果: (1 1)盲目增加试验次数盲目增加试验次数,这些试验数据还不能提供充分,这些试验数据还不能提供充分的信息,在许多复因子试验问题中达不到试验目的。的信息,在许多复因子试验问题中达不到试验目的。 (2 2)对模型的合适性有时无法检验对模型的合适性有时无法检验,因为在被动处理数,因为在被动处理数据时在同一试验点上不一定存在重复试验数据。据时在同一试验点上不一定存在重复试验数据。 为了适应寻求最佳工艺、最佳配方、建立生产过程的数为了适应寻求最佳工艺
4、、最佳配方、建立生产过程的数学模型等的需要,人们就要求以较少的试验次数建立精度学模型等的需要,人们就要求以较少的试验次数建立精度较高的回归方程。较高的回归方程。 为此,要求摆脱古典回归分析的被动局面,主动把试验为此,要求摆脱古典回归分析的被动局面,主动把试验的安排、数据的处理和回归方程的精度统一起来考虑,即的安排、数据的处理和回归方程的精度统一起来考虑,即根据试验目的和数据分析的要求来选择试验点,不仅使得根据试验目的和数据分析的要求来选择试验点,不仅使得在每一个试验点上获得的数据含有最大的信息,从而减少在每一个试验点上获得的数据含有最大的信息,从而减少试验次数,而且使数据的统计分析具有一些较好
5、的性质。试验次数,而且使数据的统计分析具有一些较好的性质。 这就是二十世纪五十年代发展起来的这就是二十世纪五十年代发展起来的“回归设计回归设计”所研所研究的问题。究的问题。 回归设计的分类:回归设计的分类: 根据建立的回归方程的次数不同,回归设计通常有一次根据建立的回归方程的次数不同,回归设计通常有一次回归设计、二次回归设计等;回归设计、二次回归设计等; 根据设计的性质又有正交设计、旋转设计、通用设计和根据设计的性质又有正交设计、旋转设计、通用设计和最优设计等。最优设计等。 本章仅介绍二次回归的各种设计方法。本章仅介绍二次回归的各种设计方法。 5.1.2 多项式回归模型多项式回归模型 在一些试
6、验中希望建立试验指标在一些试验中希望建立试验指标 y 与各个定与各个定量因子量因子 之间关系的定量表达式,之间关系的定量表达式,即回归方程,以便通过该回归方程找出使指标即回归方程,以便通过该回归方程找出使指标满足极值要求的各因子的取值。满足极值要求的各因子的取值。 可以假定可以假定 y与与 间有如下关系:间有如下关系: 这这里里 是是 的的一一个个函函数数,其图形也称为响应曲面。其图形也称为响应曲面。 是是随随机机误误差差,通通常常假假定定它它服服从从均均值值为为0 0,方差为方差为 的正态分布。的正态分布。 试验设计中,我们称试验设计中,我们称 为因子或自变量。为因子或自变量。称称 的可能取
7、值的空间为因子空间。的可能取值的空间为因子空间。 我们的任务就是从因子空间中寻找一个最佳工艺我们的任务就是从因子空间中寻找一个最佳工艺条件(最优点)条件(最优点) ,使,使y满足要求。满足要求。 当当f 的函数形式已知时,可以通过最优化的方法的函数形式已知时,可以通过最优化的方法去寻找去寻找 。在许多情况下。在许多情况下f 的形式并不知道,这的形式并不知道,这时常常用一个多项式去逼近它,即假定:时常常用一个多项式去逼近它,即假定: 这里各这里各 为未知参数,称为回为未知参数,称为回归系数,通常需要通过试验数据对它们进行估计。归系数,通常需要通过试验数据对它们进行估计。在实际中常用如下的一次与二
8、次回归方程:在实际中常用如下的一次与二次回归方程:若用若用 表示相应的估计,则称表示相应的估计,则称 为为y关于关于 的的多项式回归方程多项式回归方程。 5.1.3 多元线性回归多元线性回归 多项式回归模型,在对变量作了变换并重新命名后也可多项式回归模型,在对变量作了变换并重新命名后也可以看成是一个多元线性回归模型。比如对二次回归模型以看成是一个多元线性回归模型。比如对二次回归模型令令即变成五元线性回归模型。即变成五元线性回归模型。 1 1回归模型回归模型 假定回归模型为:假定回归模型为: 记随机变量的观测向量为记随机变量的观测向量为回归参数向量为回归参数向量为 ,随机误差向量为,随机误差向量
9、为结构矩阵结构矩阵上述模型可以表示为矩阵形式:上述模型可以表示为矩阵形式: 2回归系数的最小二乘估计回归系数的最小二乘估计 估计回归模型中回归系数的方法是最小二乘法。估计回归模型中回归系数的方法是最小二乘法。 记回归系数的最小二乘估计为记回归系数的最小二乘估计为 ,应满足,应满足如下正规方程组:如下正规方程组: 当当 存在时,最小二乘估计为:存在时,最小二乘估计为: 在求得了最小二乘估计后,可以写出回归方程:在求得了最小二乘估计后,可以写出回归方程: 3对回归方程的显著性检验对回归方程的显著性检验 对回归方程的显著性检验是指检验如下假设:对回归方程的显著性检验是指检验如下假设: H0: H1:
10、 不全为不全为0 则平方和分解式则平方和分解式 其中其中 为残差平方和,自由度为为残差平方和,自由度为 为回归平方和,自由度为为回归平方和,自由度为 当当H0为真时,有为真时,有 给定的显著性水平给定的显著性水平 ,拒绝域为拒绝域为 4失拟检验失拟检验 当在某些点有重复试验数据,便可以对试验指标当在某些点有重复试验数据,便可以对试验指标 y 的期的期望是否是望是否是 的函数进行检验,这种检验称为失拟的函数进行检验,这种检验称为失拟检验,它检验如下假设:检验,它检验如下假设: 当当在在有有些些试试验验点点上上有有mi重重复复试试验验时时,试试验验点点为为n,总总试试验验次次数数为为N,残残差差平
11、平方方和和可可进进一一步步分分解解为为组组内内平平方方和和与与组组间间平平方方和和,其其中中组组内内平平方方和和就就是是纯纯误误差差平平方方和和,记记为为 ,组组间平方和称为失拟平方和,记为间平方和称为失拟平方和,记为 ,即:,即: ,检验统计量为检验统计量为 在在H H0 0为真时,为真时, ,对于给定的显著性水平,对于给定的显著性水平 下,拒绝域为:下,拒绝域为: 当拒绝当拒绝H H0 0时,需要寻找原因,改变模型,否则接受线性回时,需要寻找原因,改变模型,否则接受线性回归模型合适,可以将归模型合适,可以将S Se e与与S SLfLf合并作为合并作为S SE E检验方程是否显著。检验方程
12、是否显著。其中其中 5对回归系数的显著性检验对回归系数的显著性检验 当回归方程显著时,可进一步检验某个回归系数是否为当回归方程显著时,可进一步检验某个回归系数是否为0 0,也即检验如下假设:也即检验如下假设: 每一项回归系数每一项回归系数j =1,2,=1,2, , p逐一进行。逐一进行。 常用的检验方法是常用的检验方法是t t检验或等价的检验或等价的F F检验,检验,F F统计量为:统计量为: 其中其中 是是 中的第中的第j j +1+1个对角元素。个对角元素。 记分子为记分子为 ,它是因子,它是因子 的回归平方和。的回归平方和。 分母分母 是模型中是模型中 的无偏估计。的无偏估计。 当当H
13、 H0j0j为真时,有为真时,有 。 给定的显著性水平给定的显著性水平 ,当,当 时拒绝原假时拒绝原假设设H H0j0j,即认为,即认为 显著不为零,回归关系显著;否则人为显著不为零,回归关系显著;否则人为回归关系不显著,可以将对应的变量从回归方程中删除。回归关系不显著,可以将对应的变量从回归方程中删除。 注:当有不显著的系数时,一般情况下一次只能删除注:当有不显著的系数时,一般情况下一次只能删除一个一个F F值最小的变量,重新计算回归系数,再重新检验。值最小的变量,重新计算回归系数,再重新检验。通常要到余下的系数都显著时为止。通常要到余下的系数都显著时为止。 5.1.4 因子水平的编码因子水
14、平的编码 在回归问题中各因子的量纲不同,其取值的范围也不在回归问题中各因子的量纲不同,其取值的范围也不同,为了数据处理的方便,对所有的因子作一个线性变同,为了数据处理的方便,对所有的因子作一个线性变换,使所有因子的取值范围都转化为中心在原点的一个换,使所有因子的取值范围都转化为中心在原点的一个单位单位“立方体立方体”中,这一变换称为对因子水平的编码。中,这一变换称为对因子水平的编码。 方法如下:方法如下: 设因子设因子 的取值范围为:的取值范围为: 与与 分别为因子分别为因子 的下水平的下水平( )( )与上水平与上水平( )( ) 其中心也称为零水平:其中心也称为零水平: 因子的变化半径为因
15、子的变化半径为 令编码值令编码值 ,而实际值,而实际值 此变换式就称为此变换式就称为“编码变换编码变换” 例例5.1.1 5.1.1 因子因子z z的取值范围为:的取值范围为:1030, ,对其作编码:对其作编码: 编码后,编码后,10对应对应-1,30对应对应1,20对应对应0。 变换后,正交点在编码空间变换后,正交点在编码空间为中心在原点的立方体,其边为中心在原点的立方体,其边长为长为2 2。 编码变换后,编码变换后,z zm m对应的编码为对应的编码为 ,z zM M对应的编码为对应的编码为 ,z z0 0对应的对应的编码为编码为0 0。这样不管什么取值范。这样不管什么取值范围,都转化为
16、值域围,都转化为值域-1,1-1,1或或- , - , 。见示意图。见示意图。5.2 BoxBoxBenhkenBenhken设计设计BoxBoxBehnkenBehnken设计是由统计学家设计是由统计学家BoxBox和和BehnkenBehnken 提出的一种比较常用的回归设计提出的一种比较常用的回归设计方法,适用于方法,适用于2 2至至5 5个因子的优化实验。个因子的优化实验。BoxBoxBehnkenBehnken设计首先假定实验范围内设计首先假定实验范围内因子存在二次项,其基试验点的选取为编因子存在二次项,其基试验点的选取为编码立方体的每条棱的中点,即码立方体的每条棱的中点,即任意两因
17、子任意两因子做做2 22 2交互,而交互,而其它因子固定在其它因子固定在0 0水平水平。再加上中心点。再加上中心点。三因子三因子Box-Box-BehnkenBehnken设计设计 试验点示意图试验点示意图BoxBoxBenhkenBenhken设计设计例题例题:对超高压杀灭枯草芽孢:对超高压杀灭枯草芽孢杆菌效果杆菌效果Y Y的研究发现:温度、的研究发现:温度、压力、保压时间是灭活枯草芽压力、保压时间是灭活枯草芽孢杆菌显著影响因子。孢杆菌显著影响因子。 研究结果表明杀灭研究结果表明杀灭6 6个数量个数量级的枯草芽孢杆菌的杀菌条件:级的枯草芽孢杆菌的杀菌条件:温度为温度为T T=30=30606
18、0,压力为,压力为P P=200=200600 600 MPaMPa,保压时间为,保压时间为M M=10=1020min20min,试分析最优杀,试分析最优杀菌工艺参数。菌工艺参数。BoxBoxBenhkenBenhken设计设计BoxBoxBenhkenBenhken设计设计题解:题解:本试验采用本试验采用Box-Box-BehnkenBehnken设计,以温设计,以温度度T T,压力,压力P P,保压时间,保压时间M M 三个外界因子为自三个外界因子为自变量,并以变量,并以+1+1、0 0、-1-1分别代表自变量的高、分别代表自变量的高、中、低水平,对自变量进行编码。中、低水平,对自变量进
19、行编码。 超高压杀灭菌的数量级超高压杀灭菌的数量级Y Y为响应值(为响应值(Y Y = -= -loglog1010 N Nt t/N/N0 0 ,即经超高压作用后枯草芽孢,即经超高压作用后枯草芽孢杆菌死亡的数量级,杆菌死亡的数量级,N Nt t为超高压处理后为超高压处理后1ml1ml菌液中的活菌数,菌液中的活菌数,N N0 0为对照为对照1ml1ml菌液中的活菌液中的活菌数)菌数)BoxBoxBenhkenBenhken设计设计因子因子代号代号水平水平编码-1-10 01 1温度温度()()T T303045456060压力力( (MPaMPa) )P P200200400400 60060
20、0保保压时间(min)(min)M M101015152020试验因子的水平及编码表试验因子的水平及编码表BoxBoxBenhkenBenhken设计设计试验设计与试验结果列表试验设计与试验结果列表TrialNo.TPMY1-10-14.27210-15.443-1015.1141015.795-1-102.1161-103.217-1106.0481106.8790-1-12.70100-113.441101-16.23120116.43130005.45140005.32150005.67160005.43170005.23BoxBoxBenhkenBenhken设计设计分析结果分析结果F
21、actorDFSSMSFPT42.0412470.51031213.670.0020P426.7978746.699469179.46.0001M40.7164850.1791214.800.0352在在0.050.05水平下,只有温度(水平下,只有温度(T T)压力()压力(P P)和保压时间(和保压时间(M M)与灭菌效果都存在显著的)与灭菌效果都存在显著的回归关系。回归关系。在在T=60.37, P=663.87, M=13.51 T=60.37, P=663.87, M=13.51 时,灭菌时,灭菌效果最大,达到效果最大,达到6.796.79。需要进行试验验证。需要进行试验验证。Box
22、BoxBenhkenBenhken设计设计T=60.37, P=663.87, M=13.51T=60.37, P=663.87, M=13.51时,极大值时,极大值Y=6.79Y=6.795.3 二次回归的中心组合设计二次回归的中心组合设计 一、中心组合设计方案一、中心组合设计方案 中心组合设计中的试验点由三部分组成:中心组合设计中的试验点由三部分组成: (1 1)将将编编码码值值-1-1与与1 1看看成成每每个个因因子子的的两两个个水水平平,采采用用二二水水平平正正交交表表安安排排试试验验,可可以以是是全全因因子子试试验验,也也可可以以是是其其1/21/2实实施施,1/41/4实实施施等等
23、,称称这这种种试试验验点点为为正正交交点点。这这样样的点有的点有mc c=2=2p个,选取正交表的个,选取正交表的p个基本列构成。个基本列构成。 (2 2)在在每每一一因因子子的的坐坐标标轴轴上上取取两两个个试试验验点点,该该因因子子的的编编码码值值分分别别为为 - - 与与 ,其其它它因因子子的的编编码码值值为为0 0。由由于于有有p个个因因子子,因因此此这这部部分分试试验验点点共共有有2 2p个个。称称这这种种试试验验点点为为星号点星号点或或主轴点主轴点。 (3 3)在在试试验验区区域域的的中中心心进进行行m0 0次次重重复复试试验验,这这时时每每个因子的编码值均为个因子的编码值均为0 0
24、。称这种试验点为。称这种试验点为中心点中心点。 如如p =2=2的中心组合设计方案是:的中心组合设计方案是: 如如p =2=2的中心组合设计试验点的分布图的中心组合设计试验点的分布图二、中心组合设计方案的特点二、中心组合设计方案的特点 该方案总试验次数该方案总试验次数n为:为: 每个因子都取每个因子都取5 5个水平,故该方案所布的试验点个水平,故该方案所布的试验点范围较广。范围较广。 该方案还有较大的灵活性,因为在方案中留有该方案还有较大的灵活性,因为在方案中留有两个待定参数两个待定参数 m0 0(中心点的试验次数)和(中心点的试验次数)和 (主轴点的位置),使二次回归设计具有正交性、(主轴点
25、的位置),使二次回归设计具有正交性、旋转性等。旋转性等。 中心点处的中心点处的m0 0次重复,可以准确估计试验误差,次重复,可以准确估计试验误差,从而使对方程与系数的检验有了可靠依据。从而使对方程与系数的检验有了可靠依据。5.4 二次回归正交设计二次回归正交设计 二次回归正交设计二次回归正交设计是是二次回归中心组合设计二次回归中心组合设计的一的一种常用设计方法。种常用设计方法。 如果一个设计具有正交性,则数据分析将是十分如果一个设计具有正交性,则数据分析将是十分方便的,由于所得的回归系数的估计值之间互不相方便的,由于所得的回归系数的估计值之间互不相关,因此删除某些因子时不会影响其它的回归系数关
26、,因此删除某些因子时不会影响其它的回归系数的估计,从而很容易写出所有回归系数为显著的回的估计,从而很容易写出所有回归系数为显著的回归方程。归方程。 我们可以适当选择我们可以适当选择m0 0与与 使二次回归中心组合设使二次回归中心组合设计具有正交性。计具有正交性。5.4.1 二次中心组合设计的结构矩阵二次中心组合设计的结构矩阵X X与系数矩阵与系数矩阵 p =2=2的中心组合设计回归模型的结构式为的中心组合设计回归模型的结构式为 结构矩阵如下:结构矩阵如下: x0 x1 x2 x1x2 (x1)2 (x2) 2这里这里mc=4,2p=4,则,则n = mc+2p+m0 = 8+m0,再记,再记那
27、么那么各平方项所对应的行、列在非对角线都有非各平方项所对应的行、列在非对角线都有非0 0元素元素5.4.2 正交性的实现正交性的实现 要使中心组合设计具有正交性,就要求要使中心组合设计具有正交性,就要求 为对角阵。为对角阵。 首首先先利利用用“中中心心化化”变变换换使使各各平平方方项项列列的的和和为为0 0,为为此此把把列的元素减去该列的均值,而此时的列的元素减去该列的均值,而此时的 阵为:阵为: 这里这里GG是是p阶对称方阵:阶对称方阵: 为使设计成为正交的只要设法使为使设计成为正交的只要设法使g=0因为因为 n = mc+2p+m0设定设定 m0后,因此可以适当选取后,因此可以适当选取 使
28、使 g = 0 。对不同的因子个数对不同的因子个数 p 与中心点重复次数与中心点重复次数 m0,对对应的值见表应的值见表5.4.1。 表表5.4.1 二次回归正交设计的参数二次回归正交设计的参数 值表值表 1 1回归系数的估计回归系数的估计 在对在对 列作了中心化变换后,我们可以首先建立列作了中心化变换后,我们可以首先建立y 关于关于诸诸 的回归方程:的回归方程: 再记再记 ,其中,其中 则各项回归系数:则各项回归系数:5.4.3 统计分析统计分析2对回归方程与回归系数的检验对回归方程与回归系数的检验 由于是正交设计,各项由于是正交设计,各项 的回归平方和为的回归平方和为 总回归平方和为总回归
29、平方和为 仍然用仍然用 表示总平方和,其自由度为表示总平方和,其自由度为 ,则残差,则残差平方和为平方和为回归方程的检验:回归方程的检验: 若在中心点上有重复试验的话,还可以进一步对若在中心点上有重复试验的话,还可以进一步对 进行进行分解:分解: 则失拟项:则失拟项: 可用可用 对二次回归模型的合适性进行检验。对二次回归模型的合适性进行检验。 各项回归系数可用各项回归系数可用进行检验。进行检验。 例例5.4.1 5.4.1 为提高钻头的寿命,在数控机床上进行试验,为提高钻头的寿命,在数控机床上进行试验,考察钻头的寿命与钻头轴向振动频率考察钻头的寿命与钻头轴向振动频率F F及振幅及振幅A A的关
30、系。的关系。 在试验中,在试验中,F F与与A A的变动范围分别为:的变动范围分别为:125 Hz125 Hz,375Hz375Hz与与1.51.5,5.55.5,采用二次回归正交组合设计,并在中心点重复,采用二次回归正交组合设计,并在中心点重复进行三次试验。进行三次试验。1对因子的取值进行编码对因子的取值进行编码 现在有两个因子,即现在有两个因子,即p=2=2,现在中心点进行三次试验,现在中心点进行三次试验,即即m0 0=3=3,则查得此二次回归正交组合设计中的,则查得此二次回归正交组合设计中的 =1.148=1.148。 因子因子F F与与A A的零水平分别是的零水平分别是250250,3
31、.5; 3.5; 它们的变化半径它们的变化半径分别是分别是109109,1.74. 1.74. 因子编码值见表因子编码值见表5.4.45.4.4。5.4.4 2试验计划与试验结果试验计划与试验结果 本例的试验计划及试验结果见表本例的试验计划及试验结果见表5.4.5。表表5.4.5 5.4.5 试验计划与试验结果试验计划与试验结果 5.4.6 3参数估计参数估计4. 模型、方程及系数的检验模型、方程及系数的检验 本例中由于在中心点有本例中由于在中心点有3 3次重复试验,所以在给出所得到次重复试验,所以在给出所得到的回归方程之前,先对模型的合适性、方程及系数作显著的回归方程之前,先对模型的合适性、
32、方程及系数作显著性检验:性检验: 中心点上中心点上3 3次试验结果的平均值为次试验结果的平均值为 =206=206,由此求得纯,由此求得纯误差平方和误差平方和 S Se e=1026=1026, 从而失拟平方和为:从而失拟平方和为:S SLfLf=1281.53-1026=255.53=1281.53-1026=255.53, 失拟检验的统计量为:失拟检验的统计量为: 在在 时,时, ,所以认为模型合适。,所以认为模型合适。 有关方程与系数的检验见表有关方程与系数的检验见表5.4.75.4.7。 由于由于 ,所以认为方程显著。又,所以认为方程显著。又 , 。所以。所以 与与 的系数在显著性水平
33、的系数在显著性水平0.050.05上是上是显著的,显著的,x x2 2的系数在显著性水平的系数在显著性水平0.100.10上是显著的。上是显著的。5.4.75. 写出二次回归方程并求最佳条件写出二次回归方程并求最佳条件 我们可以写出在我们可以写出在0.100.10水平上各系数都显著的回归方程为:水平上各系数都显著的回归方程为:再将再将(5.4.16)(5.4.16)代入,即可得代入,即可得y关于关于x1 1, ,x2 2的二次回归方程:的二次回归方程: 最后再将编码式最后再将编码式代入,即可得代入,即可得y关于关于F,A的二次回归方程:的二次回归方程: 为延长寿命,可以将回归方程对为延长寿命,
34、可以将回归方程对F F与与A A分别求导,并令其分别求导,并令其为零以解出最佳水平组合为为零以解出最佳水平组合为F=291.58F=291.58,A=3.50A=3.50,在该水平,在该水平组合下,平均寿命的估计是组合下,平均寿命的估计是211.6211.6。 5.5 二次回归旋转设计二次回归旋转设计5.5.1 旋转性旋转性 回归正交设计的最大优点是试验次数较少,计算简便,回归正交设计的最大优点是试验次数较少,计算简便,又消除了回归系数间的相关性。又消除了回归系数间的相关性。 但是其缺点是预测值的方差依赖于试验点在因子空间中但是其缺点是预测值的方差依赖于试验点在因子空间中的位置。由于误差的干扰
35、,试验者不能根据预测值直接寻的位置。由于误差的干扰,试验者不能根据预测值直接寻找最优区域。找最优区域。 若能使二次设计具有若能使二次设计具有旋转性旋转性,即能使与试验中心距离相,即能使与试验中心距离相等等( () )的点上预测值的方差相等,即的点上预测值的方差相等,即VarVar( )=( )=f( () ),那,那就有助于克服上述缺点。就有助于克服上述缺点。 所以试验者常常希望牺牲部分的正交性而获得旋转性,所以试验者常常希望牺牲部分的正交性而获得旋转性,计算的工作量可以交由计算机帮助处理。计算的工作量可以交由计算机帮助处理。 5.5.2 二次旋转设计二次旋转设计 一一个个中中心心组组合合设设
36、计计要要成成为为二二次次旋旋转转设设计计应应满满足足旋旋转转性性条件和非退化条件。条件和非退化条件。 1. 二次设计的旋转性条件二次设计的旋转性条件 二次设计的旋转性条件为:二次设计的旋转性条件为:2.2.二次旋转设计的非退化条件:二次旋转设计的非退化条件: 为使设计是使矩阵为使设计是使矩阵 不退化,就要求试验点的分不退化,就要求试验点的分布满足:布满足: 在中心组合设计方案中在中心组合设计方案中n个试验点分布在三个不同半径个试验点分布在三个不同半径的球面上,其中:的球面上,其中: 个点分布在半径为个点分布在半径为 的球面上;的球面上; 2 2p个点分布在半径为个点分布在半径为 的球面上;的球
37、面上; 个点分布在半径为个点分布在半径为 的球面上。的球面上。 满足不会使矩阵满足不会使矩阵 退化的条件。退化的条件。3. 的选取的选取 为使设计满足旋转性条件只要适当选取参数为使设计满足旋转性条件只要适当选取参数 ,在中心组,在中心组合设计中有:合设计中有: 因此因此 , ,为使设计具有旋转性,则要求,为使设计具有旋转性,则要求 即只要:即只要: 或或 当对中心组合设计提出进一步的要求时,可以确定设计中当对中心组合设计提出进一步的要求时,可以确定设计中的另一个参数的另一个参数m0 0。 5.5.3 二次回归正交旋转设计二次回归正交旋转设计(Orthogonal) 当要求一个回归设计不仅具有当
38、要求一个回归设计不仅具有旋转性旋转性,还要求具有,还要求具有正交正交性性,或至少是近似正交的,称为,或至少是近似正交的,称为二次回归正交旋转设计二次回归正交旋转设计。这需要使这需要使 的非对角线元素全为的非对角线元素全为0 0,即只需要:,即只需要: 在在g的表达式中,的表达式中,mc c是给定的,因为满足旋转性是给定的,因为满足旋转性 也已也已确定,式中确定,式中 ,所以,所以g只是只是m0 0的函数,所的函数,所以可解出以可解出m0 0。 如果解得的如果解得的m0 0是整数,则所得设计为正交旋转设计;是整数,则所得设计为正交旋转设计;如果如果m0 0不是整数,则取最接近的整数,这时是近似正
39、交不是整数,则取最接近的整数,这时是近似正交的旋转设计。的旋转设计。 二次回归正交(或近似正交)旋转组合设计的参数二次回归正交(或近似正交)旋转组合设计的参数 与与m0 0见表见表5.5.15.5.1。表表5.5.1 二次回归正交旋转组合设计参数二次回归正交旋转组合设计参数5.5.4 二次回归通用旋转设计二次回归通用旋转设计( (Uniform Precision) ) 所谓一个设计具有所谓一个设计具有通用性通用性是指在与编码中心距离小于是指在与编码中心距离小于1 1的任意点的任意点( (x1 1, ,x2 2, , ,xp p) )上的预测值的方差近似相等上的预测值的方差近似相等。 一一个个
40、旋旋转转设设计计各各点点预预测测值值的的方方差差仅仅与与该该点点到到中中心心的的距距离离有有关关,即即VarVar( ( )=)=f( () )。而而通通用用设设计计要要求求当当1|t|X17.8188740.2843927.493460.0001X2-8.566080.28439-30.12090.0001X310.80570.2843937.996020.0001X1*X1-0.706850.276846-2.553230.028705X1*X2-1.90.371574-5.113390.000455X1*X32.70.3715747.2663920.0001X2*X2-0.017410.
41、276846-0.06290.951088X2*X3-0.350.371574-0.941940.368422X3*X3-3.464570.276846-12.51440.00015.5.去掉不显著的项重新回归去掉不显著的项重新回归模型检验模型检验SourceDFSSMSFPrFModel73695.62527.9458526.6410.0001Error1212.029731.002478(Lackoffit)78.9213971.2744852.050110.223309(PureError)53.1083330.621667Total193707.656.6. 重新回归后重新回归后参数估
42、计参数估计TermEstimateStdErrtPr|t|X17.8188740.27093328.859050.0001X2-8.566080.270933-31.6170.0001X310.80570.27093339.883270.0001X1*X1-0.705120.262443-2.686770.019788X1*X2-1.90.353991-5.367370.000169X1*X32.70.3539917.6273110.0001X3*X3-3.462850.262443-13.19470.00017.7. 回归方程及其驻点回归方程及其驻点Y1 = 43.096+7.819*X1-
43、8.5669*X2+10.806*X3-0.705*X1*X1-1.9*X1*X2+2.7*X1*X3-0.463*X3*X3驻点处驻点处X1-4.53107鞍点鞍点X26.711891Y=-6.296 X3-0.54514特征值特征值0.865802-1.02896-4.02568 在驻点处其二次型矩阵特征值有正有负,此驻点为鞍点,在驻点处其二次型矩阵特征值有正有负,此驻点为鞍点,不存在极值,需进行岭脊分析。不存在极值,需进行岭脊分析。8.8. 岭脊分析岭脊分析半径半径Y预测值预测值标准误标准误X1X2X3043.1103180.4286350000.145.7716310.4272330.
44、086905-0.0932550.1097060.248.4318250.4238690.180418-0.1906540.2103300.351.1010420.4211250.278880-0.2914100.3030960.453.7871420.4233790.381000-0.3948910.3891690.556.4962010.4364940.485803-0.5006040.4695790.659.2329320.4666900.592567-0.6081610.5452040.762.0010150.5188080.700760-0.7172610.6167770.864.8
45、033500.5951280.809989-0.8276660.6849050.967.6422440.6956180.919966-0.9391880.7500891.070.5195490.8190191.030477-1.0516750.8127418.8. 岭脊分析(续)岭脊分析(续)半径半径Y预测值预测值标准误标准误X1X2X31.173.436770.9637831.141363-1.1650.8732051.276.395141.1285371.252504-1.279070.9317661.379.395671.3121991.363813-1.393790.9886631.4
46、82.439221.5139641.475222-1.509091.0440961.585.526481.733241.586681-1.624911.0982361.688.658071.9695961.698153-1.74121.1512281.791.83452.2227141.809609-1.857921.2031961.895.056192.4923591.921028-1.975021.2542471.998.323552.7783522.032395-2.092471.3044732.0101.63693.080562.143697-2.210241.3539545.6 D最
47、优混合设计最优混合设计5.6.1 D D最优设计最优设计 回归设计的正交性、旋转性和通用性各有其优回归设计的正交性、旋转性和通用性各有其优点,但是都没有涉及统计意义上的优劣。点,但是都没有涉及统计意义上的优劣。 最优设计最优设计就是从统计意义上来研究不同试验方就是从统计意义上来研究不同试验方案的优劣并建立最优方案。在所有的试验方案中,案的优劣并建立最优方案。在所有的试验方案中,能使回归预测值与观察值拟合最好的那个方案就能使回归预测值与观察值拟合最好的那个方案就是最优方案,即最优设计。是最优方案,即最优设计。 判断试验方案的优劣有很多标准,如:判断试验方案的优劣有很多标准,如:D D优良性、优良
48、性、G G优良性、优良性、A A优良性、优良性、E E优良性、优良性、I I优良性、优良性、U U优良性优良性等。其中以等。其中以D D优良性的使用最为普遍,有人证明:优良性的使用最为普遍,有人证明:事实上事实上G G优良性与优良性与D D优良性等价。优良性等价。5.6.1 D D最优设计最优设计 1943年,年,Wald提出提出信息矩阵的行列式极大值判信息矩阵的行列式极大值判别法。结构矩阵和信息矩阵与试验方案有关,设别法。结构矩阵和信息矩阵与试验方案有关,设试验方案为试验方案为,可以证明,试验方案的信息矩阵可以证明,试验方案的信息矩阵A(A() )的行列式的值的行列式的值|A(|A()|)|
49、越大,回归系数的预越大,回归系数的预测值的方差越小,预测值的方差也越小,试验方测值的方差越小,预测值的方差也越小,试验方案也就越优良。以此为依据,从各种试验方案中案也就越优良。以此为依据,从各种试验方案中挑选最优设计方案的方法,称为挑选最优设计方案的方法,称为D D最优设计最优设计。 在同一模型下,两个试验方案在同一模型下,两个试验方案1和和2,如果方案,如果方案1的信息矩阵行列式的值大于的信息矩阵行列式的值大于2的值,即的值,即:|A(|A(1)| |A()| |A(2)|)|,则说明在,则说明在D D优良性下方案优良性下方案1比比2有更好的优良性。有更好的优良性。5.6.2 D D最优混合
50、设计最优混合设计 D D优良设计一般不满足正交性和旋转性,于是有优良设计一般不满足正交性和旋转性,于是有人以回归组合设计为基础,提出了部分兼有近似人以回归组合设计为基础,提出了部分兼有近似D D优良性、正交性和旋转性的优良性、正交性和旋转性的D D最优混合设计最优混合设计。 D D最优混合设计的设计方案处理数较少,试验效最优混合设计的设计方案处理数较少,试验效率较高,回归系数和待估参数之间拟合得较好,统率较高,回归系数和待估参数之间拟合得较好,统计分析上也较为方便。到目前为止,人们已经找到计分析上也较为方便。到目前为止,人们已经找到了若干了若干2 2至至6 6个因子的个因子的D D最优混合设计
51、方案。最优混合设计方案。 如如: :R206,R207,R208,R310A,R310B,R311A,R311B,R312,R3414,R415,R416A,R416B,R416C,R521,R628A,R628B。 其中其中R R表示回归设计,第一个数字表示因子数,表示回归设计,第一个数字表示因子数,第二三位数字表示处理个数,最后的字母表示相同第二三位数字表示处理个数,最后的字母表示相同因子的方案编号。因子的方案编号。5.6.2 D D最优混合设计最优混合设计方案示例方案示例 R311AR311ANOX1X2X3Y1001.4142.200-1.4142.3-1-10.7071.41-10.
52、7071.5-110.7071.6110.7071.71.41420-0.7071.8-1.41420-0.7071.901.4142-0.7071.100-1.4142-0.7071.11000.5.6.2 D D最优混合设计最优混合设计方案示例方案示例 R416BR416BNOX1X2X3X4Y10001.7317.2000-0.2692.3-1-1-10.6045.41-1-10.6045.5-11-10.6045.611-10.6045.7-1-110.6045.81-110.6045.9-1110.6045.101110.6045.111.517700-1.0498.12-1.517
53、700-1.0498.1301.51770-1.0498.140-1.51770-1.0498.15001.5177-1.0498.1600-1.5177-1.0498.5.6.2 D D最优混合设计最优混合设计方案示例方案示例 R3414R3414NOX1X2X3Y1000.2022.3122.4202.5212.6222.7232.8220.9221.10223.11322.12112.13121.14211. 2005 2005年国家农业部下年国家农业部下发发“测土壤施肥技术规测土壤施肥技术规范范( (试行试行) )”推荐的使用推荐的使用方案,有方案,有3 3个因子、个因子、4 4个个水
54、平、水平、1414个处理,具有个处理,具有回归最优设计处理少、回归最优设计处理少、效率高的优点。效率高的优点。R3414R3414目前国内应用比较广泛目前国内应用比较广泛的田间肥效试验方案。的田间肥效试验方案。 0 0水平指不施肥,水平指不施肥,2 2水平指当地推荐施肥量,水平指当地推荐施肥量,1 1水平为水平为2 2水平的一半,水平的一半,3 3水平为水平为2 2水平的水平的1.51.5倍。倍。5.6.3 D D最优混合设计示例最优混合设计示例 例例5.6.1 5.6.1 某地甘蔗高产栽培试验,试验因子包某地甘蔗高产栽培试验,试验因子包括氮肥、磷肥和钾肥用量三个因子,各个因子的括氮肥、磷肥和
55、钾肥用量三个因子,各个因子的用量见下表,采用用量见下表,采用R311AR311A的的D D最优混合设计。最优混合设计。X1X2X3上水平上水平252512下水平下水平5525.6.3 D D最优混合设计示例最优混合设计示例因因子子水平水平-1.414-1-0.70700.70711.414X15.07.9315.022.0725.0X25.07.9315.022.0725.0X32.04.57.09.512.0经计算试验因子的水平编码如下经计算试验因子的水平编码如下试验因子的水平编码表试验因子的水平编码表5.6.3 D D最优混合设计最优混合设计示例示例试验设计方案及结果试验设计方案及结果NOX1X2X3Y1001.41421937200-1.414212323-1-10.707186541-10.70717435-110.707122936110.7071257971.41420-0.707114578-1.41420-0.70711361901.4142-0.70712124100-1.4142-0.7071285110001764