第11章 状态空间模型和卡尔曼滤波

上传人:aa****6 文档编号:57352818 上传时间:2018-10-21 格式:PPT 页数:108 大小:725.50KB
返回 下载 相关 举报
第11章  状态空间模型和卡尔曼滤波_第1页
第1页 / 共108页
第11章  状态空间模型和卡尔曼滤波_第2页
第2页 / 共108页
第11章  状态空间模型和卡尔曼滤波_第3页
第3页 / 共108页
第11章  状态空间模型和卡尔曼滤波_第4页
第4页 / 共108页
第11章  状态空间模型和卡尔曼滤波_第5页
第5页 / 共108页
点击查看更多>>
资源描述

《第11章 状态空间模型和卡尔曼滤波》由会员分享,可在线阅读,更多相关《第11章 状态空间模型和卡尔曼滤波(108页珍藏版)》请在金锄头文库上搜索。

1、1,第十一章 状态空间模型和卡尔曼滤波 State Space Models and Kalman Filter,上世纪60年代初,由于工程控制领域的需要,产生了卡尔曼滤波 (Kalman Filtering)。进入70年代初,人们明确提出了状态空间模型的标准形式,并开始将其应用到经济领域。80年代以后,状态空间模型已成为一种有力的建模工具。许多时间序列模型,包括典型的线性回归模型和ARIMA模型都能作为特例写成状态空间的形式,并估计参数值。在计量经济学文献中,状态空间模型被用来估计不可观测的时间变量:理性预期,测量误差,长期收入,不可观测因素(趋势和循环要素)。状态空间模型在经济计量学领域其

2、他方面的大量应用请参见 Harvey(1989)和 Hamilton(1994) 。,2,在一般的统计模型中出现的变量都是可以观测到的,这些模型以反映过去经济变动的时间序列数据为基础,利用回归分析或时间序列分析等方法估计参数,进而预测未来的值。状态空间模型的特点是提出了“状态”这一概念。而实际上,无论是工程控制问题中出现的某些状态(如导弹轨迹的控制问题)还是经济系统所存在的某些状态都是一种不可观测的变量,正是这种观测不到的变量反映了系统所具有的真实状态,所以被称为状态向量。这种含有不可观测变量的模型被称为UC模型(Unobservable Component Model)。,3,UC模型通过通

3、常的回归方程式来估计是不可能的,必须利用状态空间模型来求解。状态空间模型建立了可观测变量和系统内部状态之间的关系,从而可以通过估计各种不同的状态向量达到分析和观测的目的。 EViews状态空间对象对单方程或多方程动态系统提供了一个直接的、易于使用的界面来建立、估计及分析方程结果。它提供了大量的建立、平滑、滤波及预测工具,帮助我们利用状态空间形式来分析动态系统。,4,利用状态空间形式表示动态系统主要有两个优点:第一,状态空间模型将不可观测的变量(状态变量)并入可观测模型并与其一起得到估计结果;其次,状态空间模型是利用强有效的递归算法卡尔曼滤波来估计的。卡尔曼滤波可以用来估计单变量和多变量的ARM

4、A模型、MIMIC(多指标和多因果)模型、马尔可夫转换模型以及变参数模型。,5,11.1 状态空间模型的定义 在本节中,我们仅就如何定义并预测一个线性状态空间模型做以简要的讨论。状态空间模型一般应用于多变量时间序列。设 yt 是包含 k 个经济变量的 k1 维可观测向量。这些变量与 m1 维向量 t 有关,t 被称为状态向量。定义“量测方程” (measurement equation) 或称“信号方程”(signal equation)为 (11.1.1) 其中:T 表示样本长度,Zt 表示 km 矩阵,称为量测矩阵,dt 表示 k1 向量,ut 表示 k1 向量,是均值为0,协方差矩阵为

5、Ht 的不相关扰动项,即 (11.1.2),6,一般地,t 的元素是不可观测的,然而可表示成一阶马尔可夫(Markov)过程。下面定义转移方程(transition equation)或称状态方程(state equation)为(11.1.3) 其中:Tt 表示 mm 矩阵,称为状态矩阵,ct 表示 m1 向量,Rt 表示 mg 矩阵,t 表示 g1 向量,是均值为0,协方差矩阵为 Qt 的连续的不相关扰动项,即 (11.1.4) 量测方程和状态方程的扰动项的协方差矩阵用 表示,7,当 k 1 时,变为单变量模型,量测方程可以写为 (11.1.5)其中:Zt 表示 1m 矩阵,t 表示 m1

6、状态向量, ut 是方差为 2 的扰动项。,8,若使上述的状态空间模型成立,还需要满足下面两个假定:(1) 初始状态向量 0 的均值为 a0,协方差矩阵为 P0,即(11.1.6)(2) 在所有的时间区间上,扰动项 ut 和 t 相互独立,而且它们和初始状态 0 也不相关,即(11.1.7) 且(11.1.8),9,量测方程中的矩阵 Zt , dt , Ht 与转移方程中的矩阵Tt , ct , Rt , Qt 统称为系统矩阵。如不特殊指出,它们都被假定为非随机的。因此,尽管它们能随时间改变,但是都是可以预先确定的。对于任一时刻 t,yt 能够被表示为当前的和过去的 ut 和 t 及初始向量

7、0 的线性组合,所以模型是线性的。,10,例11.1 一阶移动平均模型MA(1) (11.1.9) 其中:E(t )=0,var(t)= 2,cov(t , t-s)=0, 通过定义状态向量 t =( yt ,t )可以写成状态空间形式量测方程: (11.1.10)状态方程: (11.1.11)这种形式的特点是不存在量测方程噪声。,11,对于任何特殊的统计模型,状态向量t 的定义是由结构确定的。它的元素一般包含具有实际解释意义的成分,例如趋势或季节要素。状态空间模型的目标是,所建立的状态向量t 包含了系统在时刻 t 的所有有关信息,同时又使用尽可能少的元素。所以如果状态空间模型的状态向量具有最

8、小维数,则称为最小实现(Minimal Realization)。对一个好的状态空间模型,最小实现是一个基本准则。然而对于任一特殊问题的状态空间模型的表示形式却不是惟一的,这一点很容易验证。,12,考虑通过定义一个任意的非奇异矩阵B,得到t*=Bt ,为新的状态向量。用B矩阵左乘状态方程(11.1.3),得到(11.1.12) 式中Tt* = BTt B-1,ct*= Bct ,Rt*= BRt 。相应的量测方程是(11.1.13) 式中 Zt* = Zt B-1 。,13,例11.2 二阶自回归模型AR(2) (11.1.14) 其中:E(ut) = 0,var(ut) = 2,cov(ut

9、 , ut-s) = 0, 考虑两个可能的状态空间形式( k=1, m=2 )是(11.1.15)(11.1.16)换一种形式(11.1.17),14,系统矩阵 Zt ,Ht ,Tt ,Rt ,Qt 可以依赖于一个未知参数的集合。状态空间模型的一个主要的任务就是估计这些参数,在例11.1的MA(1)模型中的参数 , 2 和例11.2的AR(2)模型中的参数 1, 2, 2 是未知的,这些参数将通过 向量表示,并被称为超参数(hyperparameters)。超参数确定了模型的随机性质,在 ct 和 dt 中出现的参数仅影响确定性的可观测变量和状态的期望值。在状态空间模型中可以引入外生变量作为解

10、释变量,也可以引入 yt 的延迟变量,这些都可以放到 dt 中去。如果 ct 或 dt 是未知参数的一个线性函数,这些未知参数也可以作为状态变量或者超参数的一部分元素。,15,例11.3 变参数模型 通常的回归模型可用下式表示,即 :其中:yt是因变量,xt是m1的解释变量向量,是待估计的m1未知参数向量,ut是扰动项。这种回归方程式所估计的参数在样本期间内是固定的,可以采用普通最小二乘法(OLS)、工具变数法等计量经济模型的常用方法进行估计。,16,实际上近年来,我国由于经济改革、各种各样的外界冲击和政策变化等因素的影响,经济结构正在逐渐发生变化,而用固定参数模型表现不出来这种经济结构的变化

11、,因此,需要考虑采用变参数模型(Time-varying Parameter Model)。下面利用状态空间模型来构造变参数模型。量测方程:状态方程: ,17,xt 是具有随机系数 t 的解释变量的集合,zt 是有固定系数 的解释变量集合,随机系数向量 t 是对应于(11.1.1)中的状态向量,称为可变参数。变参数 t 是不可观测变量,必须利用可观测变量 yt 和 xt 来估计。假定变参数 t 的变动服从于AR(1) 模型(也可以简单地扩展为AR(p) 模型),扰动向量 ut , t 假定为相互独立的,且服从均值为0,方差为 2和协方差矩阵为 Q 的正态分布。,18,11.2 卡尔曼滤波 (K

12、alman Filtering ),当一个模型被表示成状态空间形式就可以对其应用一些重要的算法求解。这些算法的核心是Kalman滤波。Kalman滤波是在时刻 t 基于所有可得到的信息计算状态向量的最理想的递推过程。在某些工程问题中,状态向量的当前值具有重要影响 (例如,它可以表示火箭在空间的坐标)。Kalman滤波的主要作用是:当扰动项和初始状态向量服从正态分布时,能够通过预测误差分解计算似然函数,从而可以对模型中的所有未知参数进行估计,并且当新的观测值一旦得到,就可以利用Kalman滤波连续地修正状态向量的估计。,19,以下设 YT 表示在 t = T 时刻所有可利用的信息的信息集合,即

13、YT = yT , yT-1 , , y1 。状态向量的估计问题根据信息的多少分为3种类型:(1) 当 t T 时,超出样本的观测区间,是对未来状态的估计问题,称为预测(prediction);(2) 当 t = T 时,估计观测区间的最终时点,即对现在状态的估计问题,称为滤波(filtering);(3) 当 t T 时,是基于利用现在为止的观测值对过去状态的估计问题,称为平滑(smoothing)。,20,进一步,假定 att-1 和 Ptt-1 分别表示以利用到 t-1 为止的信息集合 Yt-1 为条件的状态向量 t 的条件均值和条件误差协方差矩阵,即在本节假定系统矩阵 Zt , Ht

14、, Tt , Rt 和 Qt 是已知的,设初始状态向量 0 的均值和误差协方差矩阵的初值为 a0 和 P0,并假定 a0 和 P0 也是已知的。,21,11.2.1 Kalman滤波的一般形式1滤波,考虑状态空间模型(11.1.1)和(11.1.3),设 at-1为状态向量 t-1 的均值,也是基于信息集合 Yt-1 的 t-1 的估计量,Pt-1 表示估计误差的 mm 协方差矩阵,即(11.2.1),22,当给定 at-1 和 Pt-1 时,t 的条件分布的均值由下式给定,即(11.2.2)在扰动项和初始状态向量服从正态分布的假设下,t 的条件分布的均值 att-1 是 t 在最小均方误差意

15、义下的一个最优估计量。估计误差的协方差矩阵是(11.2.3) 式(11.2.2)和式(11.2.3)称为预测方程(pediction equations)。,23,一旦得到新的预测值 yt ,就能够修正 t 的估计 att -1,更新方程(updating equations)是(11.2.4) 和(11.2.5) 其中(11.2.6) 上述式(11.2.2)式(11.2.6)一起构成Kalman滤波的公式。,24,Kalman滤波的初值可以按 a0 和 P0 或 a10 和 P10 指定。这样,对于t =1, 2, ,T,每当得到一个观测值时,Kalman滤波提供了状态向量的最优估计。当所有的 T 个观测值都已处理,Kalman滤波基于信息集合 YT ,产生当前状态向量和下一时间期间状态向量的最优估计。这个估计包含了产生未来状态向量和未来观测值的最优预测所需的所有信息。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号