非线性时间序列第六章

上传人:今*** 文档编号:108095045 上传时间:2019-10-22 格式:DOC 页数:49 大小:3.60MB
返回 下载 相关 举报
非线性时间序列第六章_第1页
第1页 / 共49页
非线性时间序列第六章_第2页
第2页 / 共49页
非线性时间序列第六章_第3页
第3页 / 共49页
非线性时间序列第六章_第4页
第4页 / 共49页
非线性时间序列第六章_第5页
第5页 / 共49页
点击查看更多>>
资源描述

《非线性时间序列第六章》由会员分享,可在线阅读,更多相关《非线性时间序列第六章(49页珍藏版)》请在金锄头文库上搜索。

1、第六章 时间序列的平滑6.1 引论 上一章我们引进非参数函数估计的基本概念,现在将它应用到时间序列别的重要平滑问题上. 对估计慢变化时间趋势,平滑技术是有用的图示工具,它产生了时域平滑(6.2). 对将来事件和与之相联系的现在与过去变量之间的关系的非参数统计推断导致了6.3的状态域平滑. 6.4 引入的样条方法是对6.3引入的局部多项式方法的有用替代. 这此方法能够容易地推广到时间序列的条件方差(波动性)的估计,甚至整个条件分布的估计,参阅6.5.6.2 时域平滑6.2.1 趋势和季节分量 分析时间序列的第一步是画数据图. 这种方法使得人们可以从视觉上检查一个时间序列是否像一个平稳随机过程.

2、如果观察到趋势或季节分量,在分析时间序列之前通常要将它们分离开来. 假定时间序列能够分解成 , (6.1)其中表示慢变函数,称为“趋势分量”,是周期函数,称为“季节分量”,是随机分量,它被假定是零均值的平稳序列. 在使用这种分解之前,可以先用方差稳定变换或Box-Cox变换. 这类幂变换有如下以参数为指标的形式 (6.2)或具有在点处连续的变换形式.这类变换由Box和Cox(1964)给出. 注意,由在幂变换中数据必须是非负的,因此,在使用幂变换之前,可能必须先实施平移变换. 我们的目的是估计和提取确定性分量和. 我们希望残差分量是平稳的,且能够用线性和非线性技术做进一步的分析. 通过推广Bo

3、x和Jenkins(1970)而发展的一个替代方法是对时间序列重复应用差分算子,直到被差分的序列表现为平稳为止. 这时,被差分的序列可以进一步平衡时间序列技术来处理. 作为说明Box和Jenkins方法的一个例子,我们先取S&P500指数的对数变换,然后计算一阶差分. 图6.1给出了这个预处理序列. 所得序列基本上是该指数中变化的每日价格的百分比. 除了几个异常值(即1987年10月19日20.47%的市场崩盘,金融市场称之为“黑色星期一”)外,这个序列显示出平稳性. 这个变换与金融工程中常用资产定价的几何布朗运动模型的离散化有关. 图6.1 1972年1月3日至1999年12月31日(上图)

4、和1999年1月4日至1999年12月31日(下图)S&P500指数对数变换的差分 我们首先把注意力集中在没有季节分量的情形,即 . (6.3)然后,我们再在6.3.8中估计趋势和季节分量.6.2.2 滑动平均 平均是最常用的消除随机噪声的技术. 假定趋势是慢变化的,使得其能够在大小为的局部时间窗中用常数来逼近,即 . (6.4)这时能够用该窗周围的局部平均来估计: , (6.5)随着中心的改变,局部窗也在移动. 例如,在图6.2中,处所得的估计是落在第一个窗内的那些数据的平均. 窗的中心移动到新的点处以构成在这些点处的估计. 随着局部窗从左向右滑动,它的轨迹就是所得的滑动平均曲线. 这是滑动

5、平均平滑的最简单的例子. 它常常被用来验证时间序列的趋势. 图6.2描绘的是从1999年1月4日到1999年12月1日S&P500指数一个月和两个月的滑动平均. 图6.2 1999年1月4日至12月31日S&P500指数和它的21个交易日(粗线) 和41个交易日(虚线)的滑动平均 在边界处,滑动平均估计的习惯做法是忽略超出观察时间范围的那些数据. 例如,是用数据的平均所得的简单估计(时间点2右边的数据比左边更多). 这种不对称平均可能会产生边界偏倚. 当边界处趋势陡峭且带宽又大时,这种边界效应更为明显. 正如图6.2所示那样,在右边界处的滑动平均低估了趋势. 该问题能够通过使用局部线性平滑.

6、(参见6.2.6)或别的边界改善方法,比如,边界核方法(Gasser和Mller 1979;Mller 1993)和数据削尖方法(Choi, Hall和Bousson 2000)来减弱. 滑动平均数列(6.5)利用了时间周围两边的数据. 这样它还依赖于时间之后的数据. 为便于预报,单变滑动平均数列 (6.6)也常被用来验证时间趋势. 数列仅用直到时间的过去的数据.6.2.3 核平滑 滑动平均估计的一个改善方法是引进一个加权设计. 这允许对所给时间点附近的数据给予较大的权数. 这也就得到了核回归估计,定义为 . (6.7)这个估计还被称为Nadaraya-Watson估计. 参阅Nadaraya

7、(1964)和Watson(1964). 当我们使用均匀核时,上述核估计就变成滑动平均估计(6.5). 当核函数有有界支撑时,核回归估计就是一个局部数据的加权平均. 当核是模在零点的单峰函数时,附近的数据点获得更多的权. 一般地,核函数不要求有一个有界的支撑,只要它薄尾的(如它是一个有二阶矩的密度函数). 的非负性要求还能被减弱. 带宽也不必是整数. 注意,在高斯核定义中的标准化常数和核的对称Beta族只是用来保证函数是一个概率密度函数. 在核回归估计中它们并不起作用. 在计算时,我们常常标准化各种核函数使得它们如图5.2那样有相同的最大值1. 由于这种标准化,(6.7)可以直观地理解为数据点

8、的有效平均. 当核函数有在中的支撑时(这样的核还可看作是单边核),核回归估计所使用的数据仅到时间. 这是单边滑动平均(6.6)的推广. 如同在核密度估计中那样,在核回归估计中带宽是一个重要参数. 如同在图6.2中所显示的那样,大的带宽产生过度平滑的估计,遗漏趋势和所估计的峰和谷的度量上的一些可能的细节. 特别地,当使用大的带宽时,估计可能产生大的偏差. 当使用小的带宽时,仅有几个局部的数据被使用,降低了估计的方差,却导致所得估计是一条波动的曲线. 例如,用带宽,滑动平均估计(6.5)简单地复制原始数据. 为了得到满意的结果需要反复尝试和修正. 带宽的数据驱动选择能够帮助我们确定所要的平滑度.

9、正如在6.2.9所看到的那样,渐近方差本质上依赖于所研究的过程的相关结构. 因此,针对独立数据的由数据驱动选择的带宽在时域平滑中效果不佳. 实际上,Altman(1990),Chu和Marron(1991a)以及Hart(1991)指出,对相依数据,通常的留一在外(leave-one-out) 交叉核实方法效果不好. 这些作者提出了几个修正的方法. 对带宽选择的嵌入方法由Ray和Tsay(1997)以及Beran和Feng(2000)提出. 以上考虑能够通过计算核回归估计的偏倚和方差得到理解. 经过直接计算,在模型(6.3)下,核估计得偏倚为.它不依赖于误差过程. 它实际上是一个逼近误差. 当

10、带宽取得小时,逼近误差小,从而偏倚也小. 另一方面,当取得大时,大多数逼近误差是大的归因于和间的距离是大的,因此,偏倚可能是大的. 这个线性估计的方差还能够被计算. 令是过程的自协方差函数,则 . (6.8)该方差依赖于自相关函数. 进一步简化需要渐近分析. 我们将在6.2.9中讨论. 在那里我们将看到当时方差的渐近行为. 但我们现在可以指出,当带宽小时,核平滑的方差增大,这归因于在局部领域中数据点数太小的缘故.6.2.4 核平滑的变种 核平滑有许多变种. (6.7)中的分母对相对于求导数和数学上的分析是不方便的. 代替用核函数的高度作为权,我们还可用核函数下方的面积作为权. 由于核函数下方的

11、总面积是1,分母不需要. 这就是隐含在Gasser-Mller估计中的基本思想. 在现在的框架下,令,其中和. Gasser和Mller(1979)提出了以下的估计:.由于总的权,所以没有分母. Gasser-Mller估计是对Priestley和Chao(1972)早期版本的一种修正. Priestley和Chao(1972)给出的估计定义为.这个估计简单地去掉了Nadaraya-Watson估计的分母. 通过积分和变量变换逼近黎曼和,对适当选择的,我们得到总的权,如果不太接近边界,且相对于小,并使得和大,则上述积分近似地等同于.事实上,只要的支撑限制在区间内,等式就精确地成立. 换句话,对

12、不在边界区域的点,总的权近似于1. 以上观点依赖于设计点为等间隔的. 事实上,Priestley和Chao估计仅能用于等间隔情形. 它不能用于6.3所讨论的状态域平滑.6.2.5 滤波 核回归是用于工程的卷积滤波的一种特殊形式. 一般地,一个长度为的线性滤波定义为 . (6.9)当有支撑时,核回归对应. 滤波能够被设计为拥有各种性质. 例如,它能够被设计成可以去掉高频信号(低通滤波),或低频信号(高通滤波)或超出某个频率范围的信号(带通滤波);见2.3.3.核平滑是一种低通滤波. 线性滤波变换可以用递推方式来定义. 例如,单边滑动平均可以对某个,利用下式来定义,这等价于用的如下的加权滑动平均:

13、.由于权以指数速度快速衰减,以上滤波实际上仅用了时刻附近的局部数据. 平滑的有效性依赖于参数. 这种方法称为指数平滑. 指数平滑是用的的一种特殊的核平滑. 这是一种单边平滑. 它仅使用直到现大时刻的数据. 关于这方面内容的进一步讨论可参见Gijbels、Pope和Wand(1999).6.2.6 局部线性平滑 局部常数逼近(6.4)能够通过使用局部线性逼近来改善. 我们把趋势通过如下线性函数局部地近似为的函数.这样,就近似地看做上述局部线性模型的截距. 可见图6.3中时刻处的图示. 窗内的数据用一个线性回归来拟合. 对局部窗附件的数据用最小二乘方法,我们通过相对于和极小化下式可得到局部截距的估

14、计.这里引进核权是为了减少距离给定时间点较远的数据的贡献. 令和是最小二乘解. 这里用下标是为了表示所得的解依赖于给定的时间点. 这时,用局部截距来估计,它有如下的精确表示 , (6.10)其中. 当从1取到时就得到整个趋势函数. 这样,局部线性平滑实际上是一种移动线性回归方法. 正如图6.3所示那样,在处的估计由一个新的局部最小二乘问题得到. 在每个数据窗中拟合的直线用实线表示. 估计的局部截距的值位于虚垂直线和局部直线的交叉处. 局部斜率是时间趋势导数的估计. 此外,这些局部窗还可以互相重叠(见图6.2). S-Plus函数“lls.s”已写成程序差可用于计算图6.3中的平滑曲线. 这个S-Plus函数能够从本书的网址获得. 图6.3 使用Epanechnikov核和带宽所得的1999年1月4日至1999年12月31日S&P500指数局部线性拟合. 在每个窗中的虚抛物线表示每个局部数据点所得的权 局部线性平滑能够很容易地堆广到局部多项式平滑. 局部多项式拟合和它的应用的全面介绍可

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号