实施一个隐马尔可夫模型的预测在MATLAB环境下对大宗商品价格

资源描述

《实施一个隐马尔可夫模型的预测在MATLAB环境下对大宗商品价格》由会员分享，可在线阅读，更多相关《实施一个隐马尔可夫模型的预测在MATLAB环境下对大宗商品价格（11页珍藏版）》请在金锄头文库上搜索。

1、利用主成分分析法对流动性统一度量的研究中国股票市场收益、波动性与投资者情绪的实证研究基于高频数据的中国证券市场特征研究实施一个隐马尔可夫模型的预测在MATLAB 环境下对大宗商品价格2011 年报告准备: 泰勒 Sauder 培育大学企业管理布拉德利大学报告分布于 2011 年 12 月 7 日文摘隐马尔可夫模型建模提供了一个途径,通过动态系统观测时序。本文提出一种的概述 ,提出了隐马尔可夫模型,其次是教程在MATLAB来实现一个模型。为了说明应用该模型,用来预测技术是大宗商品价格。除了预言,交易策略来确定整个生产利润/亏损在 backtesting时期。1。介绍分析和预测金融时间序列的重要性

2、是为专家和学者)金融领域的。利用离散时间序列的概念,一个隐马尔可夫模型(HMM) 技术应用到模型的动态特性的大宗商品价格。首先,一套历史数据被用来初始化和火车的哦。其次,训练有素 HMM 模型被用来预测未来的商品价格在选定的返回检验时期。最后确定模型的准确性和价值,一个随机游动模型将对比产生HMM 和交易策略将实施返回检验时期。第二部分介绍了隐马尔可夫模型过程一般上下文。第 2.1 节提供了一个正式的、数学解释模型;2.2 节描述所发生的矛盾提供了良好的在HMM的解决方案。第 3 章深入总结 HMM 方法,使用 MATLAB 建模商品价格。第四章描述了数据分析和一般投入的模型。几个性能指标显示

3、在4.1 节所遵循的结果在4.2 节。在总结结果第4.3 节要求注意几个问题的建模过程。利用 HMM 的输出 ,被创建和执行交易策略在第五部分。最后,总结了研究成果和未来的讨论提供第6 部分。2。隐马尔可夫模型综述过程的工作经常被视作信号,这来自任何一个或多个来源。这些信号可以定期或不定期参数,也可能会破坏的时候。因此,数学信号模型可以用来处理信号 ,希望获得统计过程描述的来源。第一个导致马尔可夫链理论,可以进一步地推广到隐马尔可夫模型。李奥纳德大肠食物链造成一连串的影响和几个同事2 第一次出版的理论在1960 年代。在 1989 年,劳伦斯张国煊发表了他在2 教程 ,这说明该理论的在一个更普

4、遍的上下文(劳伦斯 )。这容易理解使用2 推进跨越几个的研究领域包括语音识别,语音分析、视频分析、照片分析,和生物。虽然大多数研究是金融领域的应用之外 ,它经常处理时间序列分析,因此不需要努力的过渡。2.1 正式的定义而非齐次马尔可夫过程模型是一个随机过程,它所观察到的 ,而不是描述或预测过程中 ,生成的观察。在这里的重要性在于隐马尔可夫模型。HMM 记录观察国家作为概率函数,在源被描述为一个隐藏的随机过程。嗯的特征主要由以下五个特点: N 隐状态的数量模型里面。每个州对应一个独特的国家所提供的模型。在模拟试验中 ,美国被定义为价格桶。独特的观测量的米每状态。这些符号是作为属性,v_2 V

5、= v_1,专家。,v_M 。这可以被认为方面的研究很多,每一个价格下跌桶。一个状态转移概率分布在a_ij = a_ij = P(q_(t + 1)= S_jq_t = S_i)1 我,jN发射概率分布在国家j,B = b_j(k)的地方b_j = P(v_k在 t = S_jq_t)1 j N、1k先验概率的 _i = _i 被国家我当初的观测在_i = P(q_1 = S_i)1我N 。N 的价值观 ,M,A,B, ” 和“ 可以用来生成观察序列啊= O_1 O_3 O_T成分在一个观测O_tis V,T是在序列号码的观察(Md 、股票 )。发起一个 HMM, 一个初始的状态会被选择基于先

6、验分布、t 被设置为 1。O_t = v_k 选择 S_i 根据分布。该模型移动到国家q_(t + 1)= S_j 基于转移概率分布的S_i。这个程序会继续增加t 或直到终止。更正式的 ,在这个过程中 ,通过引入 =(A,B, )地点 : _j专家 ?a_ij = 1,?b_i _t专家(O_t)= 1,? 专家对 _i = 1,a_ij,b_i(O_t),_i 0”“我,j,t 嗯基本问题 2.2 有三个基本问题必须解决关于2 之前 ,嗯都可以使用。给 =(A,B, 如何 P(O)为每一个观察序列计算吗? 一个国家如何问 = q_1 q_2 序列。 q_T 入选观察序列模型和啊? 我们如何

7、最大化P(O) 通过调整模型参数A、B” 和“ 吗? 第一个问题的解决方案可以解决一个直截了当的方式,但计算量太笨重 ,一个更有效率的过程必须找到(劳伦斯 )。因此 ,Forward-Backward算法(FB) 使用。弗拉维奥 -布里亚托利使用诱导的创造两套概率,向前和向后。总之 ,这些是用来创建一个平滑的所有值的集合。在这一特定的情况下,只有向前的概率被用于创建_T(i)= P(O_1 O_T 成分 ,q_T = S_i ),P(O )之和 _Ts ( 我) ” 和“ _1(i)= _i b_i(O_1)“为“我1N。第二个问题的答案用Viterbi算法。 Viterbi常用的 ,因为它考

8、虑到最可能在任何时刻 ,国家发生的概率在序列的状况。该算法将找到的麦克斯问对一个给定的观察序列,利用阿感应。一个数组 _t(j)是用来存储最高的概率路径 (劳伦斯 )。第三个问题可以回答或者通过一个Baum-Welch方法,Expectation-Modification法或梯度技术。张国煊声称, “ 没有已知的方法分析解决的最大概率模型,观察到的序列。事实上,鉴于观察序列作为训练数据有限 ,没有最优的模型参数的估计和”(劳伦斯 )。Baum-Welch的方法可以用来选择=(A,B, ),P(O )是一个问题 ,利用局部最大化的过程。方法采用的Baum-Welch向前向后算法模型的创建一个 r

9、e-estimation =(,B, )。利用代替 , 概率的 O 被观察到的模型能提高一些观点。这可以被定义为马克斯 ? 专家问 (, )= P(O )P(O)的似然函数收敛到一个临界点(劳伦斯 )。3。在 MATLAB环境下实现 HMM 实现 HMM 的过程 ,用 MATLAB提供各种算法在统计工具箱包裹。总结了实现下述 12 步骤。选择一个数据集模型,把它引入到结构型式。选择一个时间的框架模型和训练期间backtest结束。这就要求数据集的知识并可能受计算的能力。注:每个阶段的整个过程backtesting需要重复。高、低价格确定窗户和桶子尺寸观察价格。例如,一桶 1.00 美元的大小

10、与 windows - 5美元 ,5 美元将创造桶 :5:4 、4 号;3 号和。,1:0,0:1, 。,4、4:5。观测系统状态矩阵计算每米。创造转移概率矩阵在a_ij = P(q_(t + 1)= S_jq_t = S_i)1我,j N。在该模型中 ,概率保持离散。因此,除零的问题出现。为了解决这个问题,一个环代替了过渡的价值观与零。创造发射概率矩阵。这些价值观被认为是正常的在均值和方差都源自矩阵 M。创建一个先验概率矩阵在离散概率矩阵M 衍生。默认情况下 ,开始 HMM 算法 MATLAB 国家 1。指定一个不同的机率的分布、传递和发射矩阵的增量包括前矩阵。产生一系列问 “ 州和“O

11、” 观察 ”, 功能 hmmgenerate(长度 ,a,B) 使用;在 a和 B 代表过渡和发射矩阵分别Jaroslav) 。摘要利用数列的州和观察,hmmtrain(O,A,B)计算的最大似然估计的概率转换和观察的方式Baum-Welch算法给出初始过渡和发射矩阵(Jaroslav) 。预测未来国家及相关的价格,估计是随着矩阵使用现状。一个算法考察当前国家然后搜索通过矩阵的最大似然,找到下一个状态。一经确定,未来的状态和相关的价格是储存在矩阵,仍然不受 backtesting过程。换句话说 ,它不更新随着矩阵转换和排放过程中。重覆执行步骤第4 至 11 backtesting,直到所有的数

12、据都有一个相关的预测状态和价格。进行了较为深入的综述见附件。隐马尔可夫模型 (HMM) 基于隐马尔可夫链的证券价格模型及实证分析4。数据分析和结果探讨 HMM 模型的性能 ,预测产生的玉米现货价格在20 天的时期。最初的训练的日子开始每日价格包括2005 年 1 月和 2011 年 9 月结束。这一时期是由于委托书选择玉米乙醇,开始于 2005 年。自 2005 年以来,40%的玉米生产乙醇的需求被火烧尽,这导致了一场激烈的价格上涨,导致价格进入了一个新的制度。应该指出的是,所有的数据都聚集通过DataStream时期一直预测最小由于计算能力的限制。对玉米价格 ,一步或 “ 桶” 大小。 0

13、05 年是使用。这是由于价格的half-cent报道发生在商品市场。也是一个最大价格为$ 8 和最低价格为 1.50 美元的被选出来训练数据集。这确保了所有过去的数据将被包围。4.1 性能指标几个性能指标应用于该研究中。第一,平均绝对偏差和标准差为预测和实际价格计算。第二,在预测精度的方向确定价格的变动,并记录作为一个百分比值。4.2 结果超过 20 天的 backtesting期间 ,HMM 模型的平均绝对偏差结果了0.149美元和 0.117 美元的标准偏差预测价格。该模型也能预测33%的期间的价格变动的时期。如果这些结果来确定任何有价值的一个商人或研究员,一个随机游动模型被创造的结果

14、进行了比较。在该模型的价格变动所预测的使用比前一日的价格为当前日期的价格。从该方法预测有所发生病变。随机游动的平均绝对偏差为$ 0.100, 标准偏差为 0.098 美元。当随机漫步方法降低了预测误差,进行了 two-sample意味着假设检验确定是否存在明显差距。测试统计值会来自t =(X_1)-(X_2) )/ (S_1 2)/ n_1 +(S_2 2)/ 甲烷 ),X_1represents HMM偏差和 X_2 代表随机游动的偏差。自由的程度可以计算自由度 =(S_1 2)/ n_1 +(S_2 2)/甲烷 ) 2(1 /(n_1-1)*(S_1 2)/ n_1) 2 + 1 /(n_

15、2-1)*(S_2 2)/甲烷 ) 2) 。通过采用事先计算 ,结果为 0.1597 p-value小动物一张长有测试(Wackerly) 。这个测试显然无法拒绝原假设。因此,没有足够的证据来支持一个显著区别两个平均偏差。4.3 时,考虑的问题由于该模型检验的唯一的价格,赢得了广大数据点的火车在模型无关的backtesting时期。基于这一原理 ,它会更相关训练只可能有一个影响价格的预测未来价格。因此,一个政权转换模型可以被纳入嗯,因此只有相关数据是用来训练。这也会降低整体计算使潜在的高阶过程才能进行。另一个问题可能会出现在桶大小。利用最小的尺寸。 005 年,overfitting可能发生

16、导致模型的失败。为解决这类问题,需要进行更进一步的研究以选择最佳尺寸。5.0 的交易策略只要有一个缺少统计学意义之间的随机游动模型,嗯,一个交易策略是为了确定模型还提供价值。在设计一种策略,一个 HMM 过程的问题必须得到处理。在训练数据,如果一个国家尚未被观察到,过渡预测是国家依然是相同的。即它表现相同的随机游动模型。这是关联的,因为一个医生不想贸易对不谙内情的揣测的信息。因此,一个逻辑过滤器用来决定模型预测一个静止不动的状态。这主要表现在:1 stationarity发生或 0它不发生。如果先前的过滤器是满意,于是几个标准必须见过一个贸易起步。首先,计算预测必须为所有回报的地方backtested时期上次过滤是令人满意的。这些回报进一步相比,所设定的要求回报用户。为我们的测试,所要求的回报是 1%,这将是一个相当大的获得日常的价格。最后一步必须比较前一天的价

展开阅读全文

实施一个隐马尔可夫模型的预测在MATLAB环境下对大宗商品价格

最新文档