偏最小二乘回归方法在橡胶配方设计中的应用

上传人:jiups****uk12 文档编号:40346763 上传时间:2018-05-25 格式:PDF 页数:4 大小:157.09KB
返回 下载 相关 举报
偏最小二乘回归方法在橡胶配方设计中的应用_第1页
第1页 / 共4页
偏最小二乘回归方法在橡胶配方设计中的应用_第2页
第2页 / 共4页
偏最小二乘回归方法在橡胶配方设计中的应用_第3页
第3页 / 共4页
偏最小二乘回归方法在橡胶配方设计中的应用_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《偏最小二乘回归方法在橡胶配方设计中的应用》由会员分享,可在线阅读,更多相关《偏最小二乘回归方法在橡胶配方设计中的应用(4页珍藏版)》请在金锄头文库上搜索。

1、高立君等偏最d - - 莱回归方法在橡胶配方设计中的应用1 9 3偏最小二乘回归方法在橡胶配方设计中的应用高立君,辛掘祥( 青岛科技大学檬塑材料与工程教育部重点实验室,山东青岛2 6 6 0 4 2 )摘要;分析目前幕用舯回归分柝方法在建立橡胶配方试验中考察因素和试验数据神二捷多项式画妇横型时存在的局限性。介绍应用伯最小= 乘回归( P L S ) 方法建立二次多项式回归模型的拄术,并通过宴例演示了P L S 方法在橡胶配方设计中的应用。指出P L S 方法适应多目变量对多自变量的回归建模分析,结论可靠,整体性强。P L S 分析建模技术将为橡胶配方试验设计提供有力的技术支持。若蕾词:偏最小二

2、乘回归 橡腔配方 受计f 回归建摸橡胶配方试验的最终目的是寻求制品性能、工艺可行性和经济效益的综合平衡。橡胶配方工程师的主要工作就是要确定一系列可能控制或测得的因索对橡胶各项性能的影响,这些影响因素可以是硫化荆、促进剂、填充剂和防老剂等配方成分,也可以是硫化温度和硫化时间等加工工艺条件。而橡胶各项性能既包括拉伸强度、撕裂强度等物理性能,也包括加工性能、橡胶制品的外观等其它性能。影响橡胶各项性能的因素根多,因此橡胶配方设计常常是多因素( 变量) 的试验设计,配方设计理论和试验设计方法对于配方设计具有重要意义。试验设计包括试验点的设计和试验数据的分析两个相互联系的部分。本文介绍了一种新型的多元统计

3、数据分析方法偏最小二乘回归( P a r t i a lL e a s t S q u a r e sR e g r e s s i o n ,简称P I ,s ) 方法在橡胶配方设计中的应用。l 常用试验数据分析方法橡胶配方试验中,安排试验点比较常用的方法有正交设计、回归设计( 包括回归正交设计和回归旋转设计) 以及近几年逐渐发展起来的均匀设计等。实践表明,胶料性能和配合剂用量的关系在一定范围内可以用一个完全的二次多项式表示 1 ,若试验设计有P 个因素z 。,觑,z 。,当考察的性能指标为y 时,其通式为y 2 岛+ 点辟zz + 善且z t 。+ 嚣d 。,z ,+ ( 1 )式中,岛,

4、矗,且和风为回归系数,e 为随机误差。均匀设计和回归设计的出发点是建立多因素寻优模型,如果考虑多因素相互作用和模型最优化的实际需要,最基本的方法和要求是根据均匀设计或回归设计的试验结果建立二次多项式回归模型。显然,回归分析是均匀设计和回归设计数据分析的主要手段。从回归模型( 1 ) 可以看到,除 了常数项届以外,方程有卫旦掣项,因此使 回归系数的估计成为可能的必要条件为试验次数 n l + 卫掣。当考察的因素较多( 即p 较大) 时通常不能满足这个必要条件。目前。一般的做法是采用逐步回归分析方法,从二次多项式方程中选择方差贡献显著的因素或因素组合,删除不显著( 不重要) 的因素或因素组合,建立

5、含部分变量的回归模型。但是,从实际的橡胶配方设计和应用来看,上述回归分析方法存在几个问题。分析时,多数自变量是组合变量,其问存在着严重的多重共线性,使得分析结果很不稳定,以致有时某个因素是否选人会对回归模型产生很大的影响,使建模者左右为难;选中的自变量有时与建模者所希望的有较大出入,从专业知识方面认为是重要的变量往往落选,特别是有时单相关非常显著的变量落选,使建模者很难信服地接受这样的“最优”回归模型;所建立的回归模型中某些因索的回归系数符号反常,这与专业背景不符合;在设计配第1 4 届中国轮胎技术研讨台论文集方试验并考查外界影响因素时,配方成分是不能随意去掉的。从上述4 个问题可以看出,传统

6、的回归分析、逐步回归分析方法不能完全适应试验数据建模的需要。ZP L S近年来发展起来的P L S 分析方法弥补了普通回归分析方法的不足,被称为第2 代回归分析方法。2 1 简介P L S 是一种新型的多元统计数据分析方法,它借助提取主元的思路,有效地提取对系统解释性最强的综合信息,从而实现对高维数据空间的降维处理,较好地克服了变量多重相关性在系统建模过程中的不良影响。P L S 是于1 9 8 3 年由s w o l d 和C A I b a n o 等人首次提出的,近= 十几年来,它在理论、方法和应用方面都得到了迅速发展,较好地解决了许多以往用普通多元线性回归方法难以解决的问题口 。熟知多

7、元统计数据分析的人都知道,多元统计数据分析方法有两太类。一类是模型式的方法。以回归分析和判别分析为代表,其特点是在变量集合中有自变量和因变量之分,常通过数据分析找到因变量与自变量之间的函数关系,建立模型用于预测。另一类是认识性的方法以主成分分析和聚类分析为代表,典型相关分析亦属于此类方法。这类方法的主要特征是在原始数据中没有自变量和固变量之分,而是通过数据分析简化数据结构,观察变量问的相关性或样本点的相似性。长期以来,这两类方法的界限十分清楚,而P L S 则把它们有机地结合起来。P L S 方法具有以下优点” 。( 1 ) 提供了一种多因变量对多自变量的回归建模方法。特别当变量之间存在高度相

8、关性时,用P L S 分析建模,其分析结论更加可靠,整体性更强。( 2 ) 可以有效地解决变量之间的多重相关性问题适合在样本容量小于变量个数的情况下进行回归建模。( 3 ) 可以实现多种多元统计分析方法的综合应用。P L S 可以将建模类型的预测分析方法与非模型式的数据内涵分析方法有机地结合起来。在一个算法下可以同时实现回归建模( 多元线性回归分析) 、数据结构简化( 主成分分析) 以及两组变量间的相关分析( 典型相关分析) 。这给多维复杂系统的分析带来极大的便利,是多元数据分析中一个飞跃式的进展。2 2 基本理论与算法设有n 个样本点( 即椽胶配方试验中的试验次数) ,每个样本点有P 个自变

9、量( 即橡胶配方试验中考察的因素) z 。,z ;,z ,和q 个因变量( 即橡胶配方试验中考察的性能指标) Y 。,弛,儿,由此构成了自变量矩阵x = z ,z 。,z , 。,与因变量矩阵l r = M ,Y z ,y 。 。P L S 方法分别在矩阵x 和l ,中提取出成分t t 和u ,( 也就是说t 1 是z l ,x 2 ,z p 的线性组合,撕是Y l ,业,Y 。的线性组合) 。在提取这两个成分时,为了回归分析的需要,有以下两个要求。( 1 ) t t 和地应尽可能大地携带它们各自数据表中的变异信息( 2 ) 。与蜥的相关程度能够达到最大。这两个要求表明t t 和u 。应尽可能

10、好地代表数据表( 矩阵) x 和y ,同时自变量的成分f 。对因变量的成分m 又有最强的解释能力。如果要求t ,和“t 能分别很好地代表x 和y 中的数据变异信息,根据主成分分析原理,应该有V a r ( t 1 ) 一m a x( 2 )V a r ( M ) 一m a x( 3 )另一方面,如果根据回归建模的需要,要求t 。对“t 有最大的解释能力,由典型相关分析的思路可知“与U 。的相关度应达到最大值,即r ( t 1 ,“1 ) 一m a x( 4 )综合起来。在P L S 方法中要求t ,与U ,的协方差达到最大值。即 C o v ( t l m ) = ,而币了而丽( l m )一

11、m a x( 5 )在第一个成分t - 和“。被提取后,P L S 方法分别实施x 对t ,的回归和l ,对t 。的回归。如果回归方程已经达到满意的精度则算法终止,否则将利用x 被t 。解释后的残余信息以及l ,被t 。解释后的残余信息进行第2 轮的成分提取。如此往复,直到能达到一个较满意的精度为止。若最终高立君等偏最小二乘回归方甚在橡胶配方设计中的应用1 9 5对x 共提取了m 个成分f - ,t 2 ,t 。,P L S 方法将施行, 对f 。,t z ,t 的回归,然后再表达成弘关于原变量z l ,工:,z ,的回归方程,孟一1 ,2 ,口。下面给出一种简捷算法。首先将数据作标准化处理,

12、记x 经标准化处理后的数据矩阵为E 。一 E o 一,E 0 z ,E 0 , 。,l ,经标准化处理后的数据矩阵为F 。一 F 0 。,F o z ,F 0 。 。( 1 ) 求矩阵凰F oF 0 蜀最大特征值对应的特征向量。,求成分t ,得t l = E o m l p ,= 静E 】一E o t lp l ( 2 ) 求矩阵E ,F 0F o7 E ,最大特征值对应的特征向量m z ,求成分,得t 2 = 噩她一_ E 1 t 2p 2 一耵E z = 最- - t 2p 2 ( m ) 求矩阵E 一。F 0F 0 E _ 一,最大特征值对应的特征向量n k ,求成分t 。= E l 。

13、确定要提取的变量f 的个数m 一般采用预测残差平方和( P r e d i c t i v eR e s i d u a lE r r o rS u mo fS q u a r e ,简称P R E s s ) 的方法,即在每一步分别计算去掉1 个样本点后反应变量预测估计值和实际观测值的残差平方和P R E S 一( ,i 一;。( 一。) 2( 6 )如果P R E S S ,一P R E s s ( 一小于预定精度,那么 迭代过程结束,否则继续提取成分t ,进行迭代计算。如果根据上述原则确定共抽取m 个成分可以得到一个满意的预测模型,则求F 0 在f ,t z ,k 上的普通最小二乘回归方

14、程F 0 = t l7 1 + 如r 2 + + “,7 + j _( 7 )( 注:上述P L S 分析技术,笔者已编写相应计算机程序,并集成到自行开发的“橡胶配方优化设计系统”软件中,可为配方工程师提供试验方案设计、试验数据分析、优选配方、性能预测、绘制性能曲线和性能等高线等功能。“橡胶配方优化设计系统”软件的演示版可以从h t t p :w w w r u b b e r c a d c n 网站下载。)3 应用实例在某橡胶制品试验中,考察白炭黑、胶粉和油对胶料硫化特性和物理性能的影响。采用均匀设计方法设计了3 个考察因素7 个水平的试验。其试验方案及试验数据如表1 所示。在该试验中有3

15、 个考察因素,如果采用传统表1 试验方案及试验数据回归方法建立完全的二次多项式回归方程需要l o 个数据组合,但这里只有7 个数据组合;如前所述。逐步回归方法也不是很理想的数据处理方法。现在根据该试验结果,应用P L S 分析方法,借助于笔者开发的“橡胶配方优化设计系统”软件进行分析,得到如下二次多项式回归模型。M = - - 0 3 2 83 丑- - 0 0 6 49 x 2 + 0 1 4 97 :r 3 - - 0 3 0 38 x l 。r 2 - - 0 1 0 67 x 1 工3 + 0 0 6 47 x 2 2 3 0 3 1 79 x l2 - - 0 0 7 0l x z2

16、 + 0 1 4 08 x 321 9 6第1 4 届中国轮胎技术研讨会论文集弛= 一0 3 5 05 x l + 0 0 6 64 x 2 + 0 0 8 72 2 3 0 2 1 87 x l z 2 0 1 5 8O x I 工3 + 0 0 9 15 x 2 卫3 0 3 4 74 x 12 一O 0 6 53 x 22 + 0 0 8 52 x 3 。y 3 = 0 2 5 25 x 1 0 0 8 36 x 2 0 1 9 14 x 3 + 0 1 1 2l x l z 2 + O 0 1 42 x l z 3 一O 1 6 73 x z x s +0 2 3 4l x l2 一O 0 6 86 x 22 一O 1 8 09 x 32Y 4 0 2 0 5 t 5 x

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 毕业论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号