测井时间序列的支持向量机回归预测(doc 49页)

资源描述

《测井时间序列的支持向量机回归预测(doc 49页)》由会员分享，可在线阅读，更多相关《测井时间序列的支持向量机回归预测(doc 49页)（51页珍藏版）》请在金锄头文库上搜索。

1、测井时间序列的支持向量机回归预测摘要统计学习理论是针对小样本情况下的机器学习理论，其核心思想是通过控制学习机器的复杂度实现对学习机器推广能力的控制。支持向量机能够尽量提高学习机的推广能力，即使由有限数据集得到的判别函数对独立的测试集仍能够得到较小的误差。因此，本文把支持向量机用于测井时间序列的回归预测。首先，介绍了时间序列和支持向量机的基础理论。其次，详细介绍了支持向量机的回归原理和算法。最后，本文根据石油地质勘探的实际问题，将支持向量机运用测井曲线预测储层参数孔隙度。结果表明，该方法预测精度高，方法稳定有效。支持向量机较好的解决了小样本测井勘探的实际问题。关键词：支持向量机；时间序列；回归

2、预测Logging time series support vector machine regressionAbstract: Statistical theory is a case of machine learning theory which is based on small sample. Its core idea is the machine by controlling the complexity of learning to achieve the promotion of the ability of learning machine control. Support

3、 vector machine to maximize the generalization ability of learning machine, even if a limited data set obtained from the discriminant function on the independent test set will be smaller still error. Therefore, the support vector machine is usd to logging time series regression. First of all, this a

4、rticle introduces the theory of the time-series and the basis of support vector machine. Second, it introduces detailed information on the return of support vector machine theory and algorithm.Finally, this article in accordance with the actual geological exploration of oil will be the use of suppor

5、t vector machine prediction of reservoir parameters logging - porosity.The results show that high prediction accuracy of the method, a stable and efficient method. Support vector machine to resolve better the small sample of the practical problems logging exploration.Keywords：support vector machines

6、；time series； regression目录编号：时间：2021年x月x日书山有路勤为径，学海无涯苦作舟页码：第1页共1页第1章前言1.1 选题意义本课题的主要目的是研究支持向量机预测储层岩性参数问题。在估计孔隙度的过程中，测井的数目往往是固定且有限的，支持向量机在解决小样本问题中表现出许多特有的优势SVM方法的几个主要优点有：1.是专门针对有限样本情况的，其目标是得到现有信息下的最优解而不仅仅是样本数趋于无穷大时的最优值；2.算法最终将转化成为一个二次型寻优问题，从理论上说，得到的将是全局最优点，解决了在神经网络方法中无法避免的局部极值问题；3.算法将实际问题通过非线性变换转

7、换到高维空间，在高维空间中构造线性逼近函数来实现原空间中的非线性逼近函数，特殊性质能保证学习机有较好的推广能力，同时，它巧妙地解决了维数问题，使其算法复杂度与维数无关。对于小样本的分类问题,SVM具有调节参数较少、运算速度快等优点。通过地震或测井等信息进行油气预测是一种典型的非线性分类器设计问题,它具有已知样本数较少、属性空间维数高、没有明确的对应关系模型等特点。因此，选择支持向量机对其进行预测。1.2 研究现状近十几年来的测井技术，特别是20世纪90年代后，取得了重大进展。按照传统的观点，测井技术在油气勘探与开发中，仅仅对油气层做些储层储集性能和含油气性能(孔隙度、渗透率、含油气饱和度和油水

8、的可动性)定量或半定量的评价工作，这已远远跟不上油气工业迅猛发展的需要。而当今测井工作中评价油气藏的理论、方法技术有了长足的发展，解决地质问题的领域也在逐步扩大。90年代，统计学习理论 (Statistical Learning Theory，SLT)是一种处理小样本的统计理论，为研究有限样本情况下的统计模式识别和更广泛的机器学习问题建立了一个较好的理论框架，同时发展了一种新的方法支持向量机(Support Vector Machine,简称SVM)，能较好地解决小样本学习问题。由于神经网络等较新兴的机器学习方法的研究遇到一些重要的困难，比如如何确定网络结构的问题、过学习与欠学习问题、局部极小

9、点问题等，使得SVM迅速发展和完善，在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势，并能够推广应用到函数拟合等其他机器学习问题中。支持向量机(SVM)是数据挖掘中的一个新方法，能非常成功地处理回归问题(时间序列分析)和模式识别(分类问题、判别分析)等诸多问题，并可推广于预测和综合评价等领域。 1.3 论文内容具体来说，测井时间序列的支持向量机的回归预测的研究内容包括以下四章：第一章：前言。阐述支持向量机在测井属性参数预测地质属性数据中的应用研究课题提出的目的和意义，在综合查阅各类相关文献和分析专利检索及手工检索结果的基础上评述国内外研究概况和存在的问题，确定本文研究内容的意义和研

10、究方法的可行性。第二章：测井时间序列。主要讲述了时间序列的意义以及时间序列的预测方法，测井数据可以把它看成为时间序列。第三章：支持向量机的原理和方法。本章介绍了支持向量机的基本原理，支持向量分类，以及支持向量回归。第四章：测井时间序列的支持向量机回归预测。本章是研究的重点，主要依据测井属性参数用支持向量机预测储层属性孔隙度，并得到预测结果。第2章测井时间序列2.1 时间序列概述时间序列预测研究始于20世纪80年代初期。时间序列预测方法从广义上可以分为定性预测和定量预测。定性预测是由预测者利用以往的经验，凭借直觉做出的预感和猜测，具有较大的主观性。定量预测是指运用数学或统计方法建立数学模型，对

11、历史统计数据进行分析，从而对未来的发展做出预测，预测结果的准确性与数学模型的选择密切相关。长期以来，国内外学者对时间序列预测的理论和方法已做了大量研究，提出了各种各样的预测建模方法，这些方法大致可分为两大类，一类是以时间序列法为代表的传统方法，另一类是以人工神经网络法为代表的新型人工智能方法。传统方法中主要有时间序列法、多元线性回归法及傅立叶展开法等，传统方法比较成熟，算法简单，速度快。然而，传统方法都是线性模型方法，因此在遇到本质非线性问题时就显得无能为力。支持向量机在处理非线性问题时，首先将非线性问题转化为高维空间中的线性问题，然后用一个核函数来代替高维空间中的内积运算，从而巧妙地解决了复

12、杂计算问题，并且有效地克服了维数灾难及局部极小问题。时间序列是指按时间顺序排列的一组数据。从统计意义上讲，所谓时间序列就是将某一个指标在不同时间上的不同数值，按照时间的先后顺序排列而成的数列。这种数列由于受到各种偶然因素的影响，往往表现出某种随机性，彼此之间存在着统计上的依赖关系。从数学意义上讲，如果我们对某一个变量或一组变量进行观察测量，在一系列时刻得到的离散有序数集合称为离散数字时间序列，即随机过程的一次样本实现。设是一个随机过程，是在时刻i对过程的观测值，则称为一次样本实现，也就是一个时间序列。从系统意义上讲，时间序列就是某一系统在不同时间（地点，条件等）的响应。这时间序列具有如下的特点

13、：首先，系序列中的数据或数据点的位置依赖于时间，即数据的取值依赖于时间的变化，但不一定是时间t的严格函数。其次，每一时刻上的取值或数据点的位置具有一定的随机性，不可能完全准确地用历史预测值。再次，前后时刻（不一定是相邻时刻）的数值或数据点的位置有一定的相关性，这种相关性就是系统的动态规律。最后，从整体上看，时间序列往往呈现某种趋势性或出现周期性变化的现象。2.2 时间序列的预测方法2.2.1 时间序列线性预测方法一般来说，时间序列受趋势变化因素、季节变化因素、循环变化因素与不规则因素等四种因素的影响。70年代，由于BoxJenkins模型的提出，使得时间序列方法得以迅速发展，并很快成为预测领域

14、的主要方法之一。主要方法有：1.移动平均法移动平均是预测技术中的一种古老方法。它对一组给定的历史数据，计算其平均值，并将这一平均值作为下一时期的预测值。移动平均分为移动算术平均与移动几何平均，以及移动加权平均。这种方法非常简单但其预测精度是比较低的。2.分解方法分解方法也是一种历史悠久的方法，它的基本思想是将预测数据分解为季节因子、趋势因子、循环因子和误差或随机因子。这种方法单独使用效果并不好，但是它作为识别数据特性的一种方法，仍然有其深刻的影响力。目前的一些调整方法可视为是在其思想上的延伸。3.季节系数法周期性演变的活动是常见的事情。随着季节变化而发生的周期性的需求变化就是例子，如水果、蔬菜

15、、四季服装、啤酒、冷饮的销售量、火车乘客、旅游观光的人数等。反映在时间序列资料上，统计数据呈现明显的有规律的季节变动。季节系数法就是根据这一规律进行预测的方法。在实际预测时，要用季节系数修正没有考虑季节影响的预测值。4.BoxJenkins方法由于Box和Jenkins的开拓性工作，自回归移动平均(ARIMA)模型仍是时间序列分析的中心课题，Box和Jenkins的著作Time series Analysis：Forecastingand Control，曾一度成为时间序列分析的主要方法。Box-Jenkins方法在统计学上是完善的，有牢固的理论基础，有一套完整的程式化的建模方法。但同时这种方法是复杂的，对数据的性质也有一定的要求。另外它还要求研究者有较高的专业知识，对问题有深刻的认识。关于Box-Jenkins方法的预测精度，对于不同的运用环境有着不同的结论。但是这些方法大都侧重于理论研究，追求理论上的完善，以至于许多方法很不实用，真正能够用于解决实际问题的很少。例如用于时间序列分析的大多数方法Box-Jenkins方法，均假设各变量之间是一种线性关系，这种局限性使其在实际应用中很难准确地进行分析和预测。因为在实际的经济系统或工程系统中，总是或多或少地含有非线性因素，当非线性因

展开阅读全文