测井时间序列的支持向量机回归预测

上传人:ni****g 文档编号:432545083 上传时间:2022-08-12 格式:DOC 页数:51 大小:1.83MB
返回 下载 相关 举报
测井时间序列的支持向量机回归预测_第1页
第1页 / 共51页
测井时间序列的支持向量机回归预测_第2页
第2页 / 共51页
测井时间序列的支持向量机回归预测_第3页
第3页 / 共51页
测井时间序列的支持向量机回归预测_第4页
第4页 / 共51页
测井时间序列的支持向量机回归预测_第5页
第5页 / 共51页
点击查看更多>>
资源描述

《测井时间序列的支持向量机回归预测》由会员分享,可在线阅读,更多相关《测井时间序列的支持向量机回归预测(51页珍藏版)》请在金锄头文库上搜索。

1、测井时间序列的支持向量机回归预测摘 要记录学习理论是针对小样本状况下的机器学习理论,其核心思想是通过控制学习机器的复杂度实现对学习机器推广能力的控制。支持向量机可以尽量提高学习机的推广能力,虽然由有限数据集得到的鉴别函数对独立的测试集仍可以得到较小的误差。因此,本文把支持向量机用于测井时间序列的回归预测。一方面,简介了时间序列和支持向量机的基本理论。另一方面,具体简介了支持向量机的回归原理和算法。最后,本文根据石油地质勘探的实际问题,将支持向量机运用测井曲线预测储层参数孔隙度。成果表白,该措施预测精度高,措施稳定有效。支持向量机较好的解决了小样本测井勘探的实际问题。核心词:支持向量机;时间序列

2、;回归预测Logging time series support vector machine regressionAbstract: Statistical theory is a case of machine learning theory which is based on small sample. Its core idea is the machine by controlling the complexity of learning to achieve the promotion of the ability of learning machine control. Supp

3、ort vector machine to maximize the generalization ability of learning machine, even if a limited data set obtained from the discriminant function on the independent test set will be smaller still error. Therefore, the support vector machine is usd to logging time series regression. First of all, thi

4、s article introduces the theory of the time-series and the basis of support vector machine. Second, it introduces detailed information on the return of support vector machine theory and algorithm.Finally, this article in accordance with the actual geological exploration of oil will be the use of sup

5、port vector machine prediction of reservoir parameters logging - porosity.The results show that high prediction accuracy of the method, a stable and efficient method. Support vector machine to resolve better the small sample of the practical problems logging exploration.Keywords:support vector machi

6、nes;time series; regression目 录第1章 前 言1.1 选题意义本课题的重要目的是研究支持向量机预测储层岩性参数问题。在估计孔隙度的过程中,测井的数目往往是固定且有限的,支持向量机在解决小样本问题中体现出许多特有的优势SVM措施的几种重要长处有:1.是专门针对有限样本状况的,其目的是得到既有信息下的最优解而不仅仅是样本数趋于无穷大时的最优值;2.算法最后将转化成为一种二次型寻优问题,从理论上说,得到的将是全局最长处,解决了在神经网络措施中无法避免的局部极值问题;3.算法将实际问题通过非线性变换转换到高维空间,在高维空间中构造线性逼近函数来实现原空间中的非线性逼近函数,

7、特殊性质能保证学习机有较好的推广能力,同步,它巧妙地解决了维数问题,使其算法复杂度与维数无关。对于小样本的分类问题,SVM具有调节参数较少、运算速度快等长处。通过地震或测井等信息进行油气预测是一种典型的非线性分类器设计问题,它具有已知样本数较少、属性空间维数高、没有明确的相应关系模型等特点。因此,选择支持向量机对其进行预测。1.2 研究现状近十几年来的测井技术,特别是20世纪90年代后,获得了重大进展。按照老式的观点,测井技术在油气勘探与开发中,仅仅对油气层做些储层储集性能和含油气性能(孔隙度、渗入率、含油气饱和度和油水的可动性)定量或半定量的评价工作,这已远远跟不上油气工业迅猛发展的需要。而

8、当今测井工作中评价油气藏的理论、措施技术有了长足的发展,解决地质问题的领域也在逐渐扩大。90年代,记录学习理论 (Statistical Learning Theory,SLT)是一种解决小样本的记录理论,为研究有限样本状况下的记录模式辨认和更广泛的机器学习问题建立了一种较好的理论框架,同步发展了一种新的措施支持向量机(Support Vector Machine,简称SVM),能较好地解决小样本学习问题。由于神经网络等较新兴的机器学习措施的研究遇到某些重要的困难,例如如何拟定网络构造的问题、过学习与欠学习问题、局部极小点问题等,使得SVM迅速发展和完善,在解决小样本、非线性及高维模式辨认问题

9、中体现出许多特有的优势,并可以推广应用到函数拟合等其她机器学习问题中。支持向量机(SVM)是数据挖掘中的一种新措施,能非常成功地解决回归问题(时间序列分析)和模式辨认(分类问题、鉴别分析)等诸多问题,并可推广于预测和综合评价等领域。 1.3 论文内容具体来说,测井时间序列的支持向量机的回归预测的研究内容涉及如下四章:第一章:前言。论述支持向量机在测井属性参数预测地质属性数据中的应用研究课题提出的目的和意义,在综合查阅各类有关文献和分析专利检索及手工检索成果的基本上评述国内外研究概况和存在的问题,拟定本文研究内容的意义和研究措施的可行性。第二章:测井时间序列。重要讲述了时间序列的意义以及时间序列

10、的预测措施,测井数据可以把它当作为时间序列。第三章:支持向量机的原理和措施。本章简介了支持向量机的基本原理,支持向量分类,以及支持向量回归。第四章:测井时间序列的支持向量机回归预测。本章是研究的重点,重要根据测井属性参数用支持向量机预测储层属性孔隙度,并得到预测成果。第2章 测井时间序列2.1 时间序列概述时间序列预测研究始于20世纪80年代初期。时间序列预测措施从广义上可以分为定性预测和定量预测。定性预测是由预测者运用以往的经验,凭借直觉做出的预感和猜想,具有较大的主观性。定量预测是指运用数学或记录措施建立数学模型,对历史记录数据进行分析,从而对将来的发展做出预测,预测结果的精确性与数学模型

11、的选择密切有关。长期以来,国内外学者对时间序列预测的理论和措施已做了大量研究,提出了多种各样的预测建模措施,这些措施大体可分为两大类,一类是以时间序列法为代表的老式措施,另一类是以人工神经网络法为代表的新型人工智能措施。老式措施中重要有时间序列法、多元线性回归法及傅立叶展开法等,老式措施比较成熟,算法简朴,速度快。然而,老式措施都是线性模型措施,因此在遇到本质非线性问题时就显得无能为力。支持向量机在解决非线性问题时,一方面将非线性问题转化为高维空间中的线性问题,然后用一种核函数来替代高维空间中的内积运算,从而巧妙地解决了复杂计算问题,并且有效地克服了维数劫难及局部极小问题。时间序列是指准时间顺

12、序排列的一组数据。从记录意义上讲,所谓时间序列就是将某一种指标在不同步间上的不同数值,按照时间的先后顺序排列而成的数列。这种数列由于受到多种偶尔因素的影响,往往体现出某种随机性,彼此之间存在着记录上的依赖关系。从数学意义上讲,如果我们对某一种变量或一组变量进行观测测量,在一系列时刻得到的离散有序数集合称为离散数字时间序列,即随机过程的一次样本实现。设是一种随机过程,是在时刻i对过程的观测值,则称为一次样本实现,也就是一种时间序列。从系统意义上讲,时间序列就是某一系统在不同步间(地点,条件等)的响应。这时间序列具有如下的特点:一方面,系序列中的数据或数据点的位置依赖于时间,即数据的取值依赖于时间

13、的变化,但不一定是时间t的严格函数。另一方面,每一时刻上的取值或数据点的位置具有一定的随机性,不也许完全精确地用历史预测值。再次,前后时刻(不一定是相邻时刻)的数值或数据点的位置有一定的有关性,这种有关性就是系统的动态规律。最后,从整体上看,时间序列往往呈现某种趋势性或浮现周期性变化的现象。2.2 时间序列的预测措施2.2.1 时间序列线性预测措施一般来说,时间序列受趋势变化因素、季节变化因素、循环变化因素与不规则因素等四种因素的影响。70年代,由于BoxJenkins模型的提出,使得时间序列措施得以迅速发展,并不久成为预测领域的重要措施之一。重要措施有:1.移动平均法移动平均是预测技术中的一

14、种古老措施。它对一组给定的历史数据,计算其平均值,并将这一平均值作为下一时期的预测值。移动平均分为移动算术平均与移动几何平均,以及移动加权平均。这种措施非常简朴但其预测精度是比较低的。2.分解措施分解措施也是一种历史悠久的措施,它的基本思想是将预测数据分解为季节因子、趋势因子、循环因子和误差或随机因子。这种措施单独使用效果并不好,但是它作为辨认数据特性的一种措施,仍然有其深刻的影响力。目前的一些调节措施可视为是在其思想上的延伸。3.季节系数法周期性演变的活动是常用的事情。随着季节变化而发生的周期性的需求变化就是例子,如水果、蔬菜、四季服装、啤酒、冷饮的销售量、火车乘客、旅游观光的人数等。反映在

15、时间序列资料上,记录数据呈现明显的有规律的季节变动。季节系数法就是根据这一规律进行预测的措施。在实际预测时,要用季节系数修正没有考虑季节影响的预测值。4.BoxJenkins措施由于Box和Jenkins的开拓性工作,自回归移动平均(ARIMA)模型仍是时间序列分析的中心课题,Box和Jenkins的著作Time series Analysis:Forecastingand Control,曾一度成为时间序列分析的重要措施。Box-Jenkins措施在记录学上是完善的,有牢固的理论基本,有一套完整的程式化的建模措施。但同步这种措施是复杂的,对数据的性质也有一定的规定。此外它还规定研究者有较高的专业知识,对问题有深刻的结识。有关Box-Jenkins措施的预测精度,对于不同的运用环境有着不同的结论。但是这些措施大都侧重于理论研究,追求理论上的完善,以至于许多措施很不实用,真正可以用于解决实际问题的很少。例如用于时间序列分析的大多数措施Box-Jenkins措施,均假设各变量之间是一种线性关系,这种局限性使其在实际应用中很难精确地进行分析和预测。由于在实际的经济系统或工程系统中,总是或多或少地具有非线性因素,当非线性因素影响较小,或在某一范畴内影响较小时,可以采用线性模型来描述或逼近。但当这种描述或逼近得不

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号