《基于多元回归的炉龄问题的实现》由会员分享,可在线阅读,更多相关《基于多元回归的炉龄问题的实现(27页珍藏版)》请在金锄头文库上搜索。
1、题目:基于多元回归的炉龄问题的实现成员信息:姓名班级学号张队长队员&答辩人日期:2019年12月30日摘要工业生产在生产出产品的同时,也生产出大量关于生产过程的信息。应充分利用这些信息并在此基础上寻求如何才能使生产得到进一步改善的方法。因为钢铁生产过程特别复杂,出现的因素特别多,各因素间又相互牵连1。因此找出某一时期影响某一实际问题的最主要原因,提供优化决策,不仅对生产技术管理有很 大的参考价值,而且也有助于积累经验,还对机理性问题的研究具有启发和促进作用。现有某钢铁公司炼钢转炉的炉龄按30天炉/天炼钢规模,大约一个月就需等炉一次进行检修。为了减少消耗,厂家通过实际测定,得到33组数据。要求对
2、炉龄进行预测和分析。 本文针对此问题,进行分析并建立合适的数学模型,为解决炉龄问题提供方案。针对问题一,分析各个因素横向之间以及各个因素纵向内部数据之间的关系,采用灰度预测模型,将缺失的数据进行补全。针对问题二,通过主成分分析法找出与影响炉龄的主要因素,剔除对炉龄影响较小的因素。建立以多个影响因素为自变量和以炉龄为因变量的多元线性回归模型,并且建立了支持向量机的回归模型。针对问题三,对于多元线性回归模型,主要考虑其预测的残差来分析模型的可靠性,模型预测残差的分布越没有趋势,表示回归的结果越是可靠,所以多元线性回归模型对本问题有一定的适用性。对于支持向量机回归模型,将其与BP神经网络进行对比,发
3、现其性能明显优于BP神经网络。针对问题四,分析找出对转炉寿命影响较大的因素为喷补料量、炼钢时间和渣中含铁量,并将设计延长炉龄方案时重点放在这三个因素。关键词:转炉炉龄 灰度预测 多元线性型回归 支持向量机目录一、问题重述41.1问题背景41.2问题的提出4二、问题的分析4三、基本假设5四、符号说明5五、问题一的模型建立与求解55.1问题的分析55.2 模型的建立与求解6六、问题二的模型建立与求解96.1问题的分析96.2 模型的建立与求解9七、问题三的求解197.1问题的分析197.2 问题的求解19八、问题四的求解218.1问题的分析218.2 问题的求解21九、参考文献22一、问题重述1.
4、1问题背景自1952和1953年氧气顶吹转炉炼钢在奥地利的钢铁股份公司林茨钢厂与砂冶公司多纳维茨钢厂先后建成投产。转炉炼钢以其生产率高、品种多、质量好、热效率高、原材料适应性好、消耗低、成本低、基建投资少、建设速度快等优点,被国内外钢铁冶炼行业广泛采用,成为现代炼钢的主要方法之一。转炉炉龄是炼钢车间的一项综合性技术经济指标。炉龄的离低直接影响转炉钢产及耐火材料消耗和成本等指标。因此,炉龄的提高对于技经指标的改善和炼钢成本的降低具有十分重要的意义2。1.2问题的提出某钢铁公司炼钢转炉的炉龄按30天炉/天炼钢规模,大约一个月就需等炉一次进行检修。为了减少消耗,厂家通过实际测定,得到下表所示的数据,
5、其中x1为喷补料量、x2为吹炉时间、x3为炼钢时间、x4为钢水中含锰量、x5为渣中含铁量、x6为作业率、目标变量 y 为炉龄(炼钢炉次/炉)。要求完成如下四问:问题1:由于某种原因,造成个别数据缺失,试对这些缺失数据(表中用表示)进行补全。问题2:试根据附表数据建立炉龄的预测模型。问题3:采用适当的指标和方法对第2问建立的模型,和第1问修正数据之后的改进模型进行可靠性分析,说明模型对实际问题的适用性。问题4:为钢铁公司提出延长炉龄的方案。二、问题的分析此问题属于多元回归问题。回归问题是建立因变量 Y 与自变量 X 之间关系的模型。我们需要利用数据统计原理,对大量统计数据进行数学处理,并确定因变
6、量与某些自变量的相关关系,建立一个相关性较好的回归方程(函数表达式),并加以外推,用于预测今后的因变量的变化。根据因变量和自变量的个数分为:一元回归分析和多元回归分析。此问题属于多元回归。三、基本假设1. 所得数据可靠准确,不包含人为误差。2. 炉龄的影响因素只有喷补料量、吹炉时间、炼钢时间、钢水中含锰量、渣中含铁量、作业率六个因素。四、符号说明符号说明单位x1喷补料量x2吹炉时间x3炼钢时间x4钢水中含锰量x5渣中含铁量x6作业率y炉龄炼钢炉次/炉(k)序列的级比bj信息贡献率Q残差平方和K(xi,xj)= (xi) (xj) 核函数表1:符号说明五、问题一的模型建立与求解5.1问题的分析问
7、题一首先要求我们根据一项已知的数据,对个别数据缺失,试这些缺失数据(表中用表示)进行补全。由附表可以看出,给出的数据是一些离散的,规律性不强的数据,此时我们采用灰色预测的方法对其进行补全。灰色系统理论认为,尽管客观表象复杂,但总是有整体功能的,因此必然蕴含某种内在规律。关键在于如何选择适当的方式去挖掘和利用它。灰色系统是通过对原始数据的整理来寻求其变化规律的,这是一种就数据寻求数据的现实规律的途径,即为灰色序列的生成。一切灰色序列都能通过某种生成弱化其随机性,显现其规律性。灰色预测的主要特点是模型使用的不是原始数据序列,而是生成的数据序列。其核心体系是灰色模型(Grey Model,简称GM)
8、,即对原始数据作累加生成(或其它方法生成)得到近似的指数规律再进行建模的方法。5.2 模型的建立与求解5.2.1数据的检验与处理首先,为了保证建模方法的可行性,需要对已知数据列作必要的检验处理。设参考数据为x(0)=(x(0)(1),x(0)(2),x(0)(n),计算序列的级比:k=x0k-1x0k k=2,3,n (5.1)如果所有的级比(k)都落在可容覆盖=(e-2n+1,e2n+2)内,则序列x(0)可以作为模型GM(1,1)的数据进行灰色预测。如果所有的级比(k)都落在可容覆盖=(e-2n+1,e2n+2)内,则序列x(0)可以作为模型GM(1,1)的数据进行灰色预测。否则,需要对序
9、列x(0)做必要的变换处理,使其落入可容覆盖内。即取适当的常数c,作平移变换:y(0)(k)=x(0)(k)+c,k=1,2,n (5.2)使序列y(0)=(y(0)(1),y(0)(2),y(0)(n)的级比:yk=y0k-1y0k k=2,3,n (5.3)5.2.2建立模型1.已知参考数据列x(0)=(x(0)(1),x(0)(2),x(0)(n) (5.4)进行1次累加生成序列:x(1)=(x(1)(1),x(1)(2),x(1)(n)=(x(0)(1),x(0)(1)+x(0)(2),x(0)(1)+x(0)(n)(5.5)其中x(1)(k)=i=1kx(0)(i)(k=1,2,n)
10、。x(1)的均值生成序列:z(1)=(z(1)(2),z(1)(3),z(1)(n)(5.6)其中z(1)(k)=0.5x(1)(k)+0.5x(1)(k-1),k=2,3,n。2.建立灰微分方程x0k+az1k=b k=2,3,n(5.7)相应的白化微分方程为:dx(1)dt+ax(1)(t)=b (5.8)记u=a,bT,Y=x(0)(2),x(0)(3),x(0)(n)T,B=-z(1)(2)1-z(1)(3)1-z(1)(n)1,则由最小二乘法,求得使J(u)=(Y-Bu)T(Y-Bu)达到最小值的u的估计值u=a,bT=(BTB)-1BTY于是求解方程(5-8)得:x1k+1=x01
11、-bae-ak+ba k=0,1,n-1, (5.9)5.2.3 模型求解1.对于x4(钢水中含锰量),先选取前19个数据对第20个数据进行的级比图1:残差(k),发现不满足级比要求。多次测试后,选择:x(0)=(50,44,46,46,48,45,42,40)此时级比满足要求。由此补全所缺失的值:502.对于x6(作业率),先选取前19个数据对第27个数据进行的级比(k),发现不满足级比要求。多次测试后,选择: x(0)=(35,33.3,37.9,42.9)图2:残差此时级比、残差满足要求。由此补全所缺失的值:37.777.3.对于 y(炉龄),先选取前25各数据对第27个数据进行的级比(
12、k),发现不满足级比要求。多次测试后,选择x(0)=(832,1076,1376,914 )此时级比满足要求。由此补全所缺失的值:1366.5。图3:残差补全后的数据如下:序号x1x2x3x4x5x6y200.215520.240.25016.841.71098280.243617.737.24516.237.771105300.19717.335.94613.857.41366.5表2:应补全的数据六、问题二的模型建立与求解6.1问题的分析问题二要求根据附表数据建立炉龄的预测模型。由表中数据可以看出,我们需要找出多个变量间是否相关、相关方向与强度,并建立数学模型以便观察特定变量。对此我们采用
13、回归分析的方法。回归分析(Regression Analysis)是一种统计学上分析数据的方法,回归分析是建立因变量Y(或称依变量,反因变量)与自变量X(或称独变量,解释变量)之间关系的模型。在建立模型前,由于自变量过多,可先对自变量进行主成分分析。然后可先建立多元线性回归模型来观察。6.2 模型的建立与求解6.2.1数据的处理主成分分析的主要目的是希望用较少的变量去解释原来资料中的大部分变异,将我们手中许多相关性很高的变量转化成彼此相互独立或不相关的变量。通常是选出比原始变量个数少,能解释大部分资料中的变异的几个新变量,即所谓主成分,并用以解释资料的综合性指标。由此可见,主成分分析实际上是一
14、种降维方法。1.主成分分析法的步骤如下(1)对原始数据进行标准化处理假设进行主成分分析的指标变量有m个,分别为x1,x2,xm,共有n个评价对象,第i个评价对象的第j个指标的取值为aij。将各指标值aij转换成标准化指标值aij,aij=aij-jsj (i=1,2,n;j=1,2,m)(6.1)其中j=1ni=1naij,sj=1n-1i=1n(aij-j)2,(j=1,2,m),即j,sj为第j个指标的样本均值和样本标准差。对应地有,xj=xj-jsj (j=1,2,m) (6.2)(2)计算相关系数矩阵R相关系数矩阵R=(rij)mmrij=k=1nakiakjn-1 ,(i,j=1,2,m),(6.3)式中rii=1,rij=rji,rij是第i个指标与第j个指标的相关系数。(3)计算特征值和特征向量计算相关系数矩阵R的特征值12