时间序列经济学模型

上传人:汽*** 文档编号:580049945 上传时间:2024-08-28 格式:PPT 页数:274 大小:1.58MB
返回 下载 相关 举报
时间序列经济学模型_第1页
第1页 / 共274页
时间序列经济学模型_第2页
第2页 / 共274页
时间序列经济学模型_第3页
第3页 / 共274页
时间序列经济学模型_第4页
第4页 / 共274页
时间序列经济学模型_第5页
第5页 / 共274页
点击查看更多>>
资源描述

《时间序列经济学模型》由会员分享,可在线阅读,更多相关《时间序列经济学模型(274页珍藏版)》请在金锄头文库上搜索。

1、统 计 建 模 (4)-时间序列的经济学模型随机时间序列的计量经济学模型随机时间序列的计量经济学模型时间序列的平稳性及其检验时间序列的平稳性及其检验随机时间序列分析模型随机时间序列分析模型协整分析与误差修正模型协整分析与误差修正模型9.1 9.1 时间序列的平稳性及其检验时间序列的平稳性及其检验一、一、问题的引出:问题的引出:非平稳变量与经典回归模型非平稳变量与经典回归模型二、二、时间序列数据的平稳性时间序列数据的平稳性三、三、平稳性的图示判断平稳性的图示判断四、四、平稳性的单位根检验平稳性的单位根检验五、五、单整、趋势平稳与差分平稳随机过程单整、趋势平稳与差分平稳随机过程一、问题的引出:非平

2、稳变量与经典一、问题的引出:非平稳变量与经典回归模型回归模型常见的数据类型常见的数据类型到目前为止,经典计量经济模型常用到的数据有:到目前为止,经典计量经济模型常用到的数据有:时间序列数据时间序列数据(time-series data)截面数据截面数据(cross-sectional data)平行平行/面板数据面板数据(panel data/time-series cross-section data) 时间序列数据是最常见,也是最常用到的数据时间序列数据是最常见,也是最常用到的数据经典回归模型与数据的平稳性经典回归模型与数据的平稳性经典回归分析经典回归分析暗含暗含着一个重要着一个重要假设假

3、设:数据是数据是平稳的。平稳的。数据非平稳数据非平稳,大样本下的统计推断基础,大样本下的统计推断基础“一致性一致性”要求要求被破怀。被破怀。经典回归分析的假设之一:解释变量经典回归分析的假设之一:解释变量X是非是非随机变量随机变量依概率收敛:依概率收敛: (2) 放宽该假设:放宽该假设:X是随机变量,则需进一步要求:是随机变量,则需进一步要求: (1)X与随机扰动项与随机扰动项 不相关不相关 Cov(X, )=0 第(第(2)条是为了满足统计推断中大样本下的)条是为了满足统计推断中大样本下的“一一致性致性”特性:特性:第(第(1)条是)条是OLS估计的需要估计的需要如果如果X是非平稳数据是非平

4、稳数据(如表现出向上的趋势),(如表现出向上的趋势),则(则(2)不成立,回归估计量不满足)不成立,回归估计量不满足“一致性一致性”,基,基于大样本的统计推断也就遇到麻烦。于大样本的统计推断也就遇到麻烦。因此因此:注意:注意:在双变量模型中:在双变量模型中: 表现在表现在:两个本来没有任何因果关系的变量,两个本来没有任何因果关系的变量,却有很高的相关性却有很高的相关性(有较高的(有较高的R2)。例如:例如:如果如果有两列时间序列数据表现出一致的变化趋势(非有两列时间序列数据表现出一致的变化趋势(非平稳的),即使它们没有任何有意义的关系,但平稳的),即使它们没有任何有意义的关系,但进行回归也可表

5、现出较高的可决系数。进行回归也可表现出较高的可决系数。 数据非平稳,往往导致出现数据非平稳,往往导致出现“虚假回虚假回归归”问题问题 在现实经济生活中,在现实经济生活中,实际的时间序列数据实际的时间序列数据往往是非平稳的往往是非平稳的,而且主要的经济变量如消费、而且主要的经济变量如消费、收入、价格往往表现为一致的上升或下降。这收入、价格往往表现为一致的上升或下降。这样样,仍然通过经典的因果关系模型进行分析,仍然通过经典的因果关系模型进行分析,一般不会得到有意义的结果。一般不会得到有意义的结果。 时间序列分析模型方法时间序列分析模型方法就是在这样的情况就是在这样的情况下,下,以通过揭示时间序列自

6、身的变化规律为主以通过揭示时间序列自身的变化规律为主线而发展起来的全新的计量经济学方法论线而发展起来的全新的计量经济学方法论。 时间序列分析时间序列分析已组成现代计量经济学的重已组成现代计量经济学的重要内容,并广泛应用于经济分析与预测当中。要内容,并广泛应用于经济分析与预测当中。二、时间序列数据的平稳性二、时间序列数据的平稳性定义:定义: 假定某个时间序列是由某一假定某个时间序列是由某一随机过程随机过程(stochastic process)生成的,即假定时间序列)生成的,即假定时间序列Xt(t=1, 2, )的每一个数值都是从一个概率)的每一个数值都是从一个概率分布中随机得到,如果满足下列条

7、件:分布中随机得到,如果满足下列条件: 1)均值)均值E(XE(Xt t)=)= 是与时间是与时间t 无关的常数;无关的常数; 2)方差)方差Var(XVar(Xt t)=)= 2 2是与时间是与时间t 无关的常数;无关的常数; 3)协方差)协方差Cov(XCov(Xt t,X,Xt+kt+k)=)= k k 是是只与时期间隔只与时期间隔k有关,与时间有关,与时间t 无关的常数;无关的常数; 则称该随机时间序列是则称该随机时间序列是平稳的平稳的(stationary),而该随机过程是一,而该随机过程是一平稳随机过程平稳随机过程(stationary stochastic process)。)。

8、 例例9.1.1一一个个最最简简单单的的随随机机时时间间序序列列是是一一具具有零均值同方差的独立分布序列:有零均值同方差的独立分布序列: E(Xt)= t , tN(0, 2)该序列常被称为是一个该序列常被称为是一个白噪声白噪声(white noise)。 由于由于XtXt具有相同的均值与方差,且协方差具有相同的均值与方差,且协方差为零为零, ,由定义由定义, ,一个白噪声序列是平稳的一个白噪声序列是平稳的。 例例9.1.2另一个简单的随机时间列序被称为另一个简单的随机时间列序被称为随机游走(随机游走(random walk),该序列由如下随机该序列由如下随机过程生成:过程生成: X t=Xt

9、-1+ t 这里,这里, t是一个白噪声。是一个白噪声。 容易知道该序列有相同的容易知道该序列有相同的均值均值:E(Xt)=E(Xt-1) 为了检验该序列是否具有相同的方差,可假设为了检验该序列是否具有相同的方差,可假设Xt的初值为的初值为X0,则易知,则易知: X1=X0+1 X2=X1+2=X0+1+2 X Xt t=X=X0 0+ +1+2+t 由于由于X X0 0为常数,为常数, t t是一个白噪声,因此是一个白噪声,因此: : Var(XtVar(Xt)=t)=t 2 2即即Xt的的方方差差与与时时间间t t有有关关而而非非常常数数,它它是是一一非非平平稳稳序列。序列。然而,对然而,

10、对X X取取一阶差分一阶差分(first difference): Xt=Xt-Xt-1=t由于由于 t t是一个白噪声,则序列是一个白噪声,则序列Xt是平稳的。是平稳的。 后面将会看到后面将会看到: :如果一个时间序列是非平稳如果一个时间序列是非平稳的,它常常可通过取差分的方法而形成平稳序的,它常常可通过取差分的方法而形成平稳序列列。事实上,事实上,随机游走过程随机游走过程是下面我们称之为是下面我们称之为1阶阶自回归自回归AR(1)过程过程的特例的特例: Xt= Xt-1+t 不难验证不难验证:1)| |1时,该随机过程生成的时间序列是发散的,时,该随机过程生成的时间序列是发散的,表现为持续

11、上升表现为持续上升( 1)或持续下降或持续下降( -1),因,因此是非平稳的;此是非平稳的; 2) =1时,是一个随机游走过程,也是非平稳的时,是一个随机游走过程,也是非平稳的。9.2中将证明中将证明:只有当只有当-1-1 10,样样本本自自相相关关系系数数近近似似地地服服从从以以0为为均均值值,1/n 为为方方差差的的正正态态分分布布,其其中中n为样本数。为样本数。 也也可可检检验验对对所所有有k0,自自相相关关系系数数都都为为0的的联联合假设,这可通过如下合假设,这可通过如下QLB统计量进行:统计量进行: 该统计量近似地服从自由度为该统计量近似地服从自由度为m m的的 2 2分布分布(m

12、m为滞后长度)。为滞后长度)。 因此因此:如果计算的如果计算的Q Q值大于显著性水平为值大于显著性水平为 的临界值,则有的临界值,则有1-1- 的把握拒绝所有的把握拒绝所有 k k(k(k0)0)同同时为时为0 0的假设。的假设。 例例9.1.3:9.1.3: 表表9.1.19.1.1序列序列Random1Random1是通过一是通过一随机过程(随机函数)生成的有随机过程(随机函数)生成的有1919个样本的随个样本的随机时间序列。机时间序列。 容易验证:该样本序列的均值为该样本序列的均值为0 0,方差为,方差为0.07890.0789。 从图形看:它在其样本均值它在其样本均值0 0附近上下波动

13、,附近上下波动,且样本自相关系数迅速下降到且样本自相关系数迅速下降到0 0,随后在,随后在0 0附近附近波动且逐渐收敛于波动且逐渐收敛于0 0。 由于该序列由一随机过程生成,可以认为不由于该序列由一随机过程生成,可以认为不存在序列相关性,因此存在序列相关性,因此该序列为一白噪声。该序列为一白噪声。 根据根据BartlettBartlett的理论:的理论: k kN(0,1/19)0,1/19),因此因此任一任一r rk k(k(k0)0)的的95%95%的置信区间都将是的置信区间都将是: :可以看出可以看出:k0时,时,rk的值确实落在了该区间内,的值确实落在了该区间内,因此可以接受因此可以接

14、受 k(k0)为为0的假设的假设。同样地同样地,从从QLB统计量的计算值看,滞后统计量的计算值看,滞后17期期的计算值为的计算值为26.38,未超过,未超过5%显著性水平的临显著性水平的临界值界值27.58,因此,因此,可以接受所有的自相关系数可以接受所有的自相关系数 k(k0)都为都为0的假设。的假设。因此因此,该随机过程是一个平稳过程。该随机过程是一个平稳过程。 序列序列Random2Random2是由一随机游走过程是由一随机游走过程 X Xt t=X=Xt-1t-1+ + t t生成的一随机游走时间序列样本。其中,第生成的一随机游走时间序列样本。其中,第0 0项项取值为取值为0 0, t

15、 t是由是由Random1Random1表示的白噪声。表示的白噪声。 图形表示出:图形表示出:该序列具有相同的均值,但从样该序列具有相同的均值,但从样本自相关图看,虽然自相关系数缓慢下降到本自相关图看,虽然自相关系数缓慢下降到0,但随着时间的推移,则在但随着时间的推移,则在0附近波动且呈发散趋附近波动且呈发散趋势。势。 样本自相关系数显示样本自相关系数显示:r r1 1=0.48=0.48,落在了区间,落在了区间-0.4497, 0.44970.4497, 0.4497之外,因此在之外,因此在5%5%的显著性水平的显著性水平上拒绝上拒绝 1 1的真值为的真值为0 0的假设。的假设。 该随机游走

16、序列是非平稳的。该随机游走序列是非平稳的。例例9.1.4 检验中国支出法检验中国支出法GDP时间序列的平稳性时间序列的平稳性。 表表9.1.2 19782000年中国支出法年中国支出法GDP(单位:亿元)(单位:亿元) 图形:表现出了一个持续上升的过程图形:表现出了一个持续上升的过程,可初,可初步判断步判断是非平稳是非平稳的。的。 样本自相关系数:缓慢下降样本自相关系数:缓慢下降,再次表明它的,再次表明它的非平稳非平稳性。性。 从滞后从滞后18期的期的QLB统计量看统计量看: QLB(18)=57.1828.86=20.05 拒绝拒绝:该时间序列的自相关系数在滞后:该时间序列的自相关系数在滞后

17、1期之后期之后的值全部为的值全部为0的假设。的假设。 结论结论:19782000年间中国年间中国GDP时间序列是非平稳序列。时间序列是非平稳序列。例例9.1.59.1.5 检验检验2.102.10中关于人均居民消费与人均国中关于人均居民消费与人均国内生产总值这两时间序列的平稳性。内生产总值这两时间序列的平稳性。 原图 样本自相关图 从图形上看:从图形上看:人均居民消费(人均居民消费(CPCCPC)与人均国)与人均国内生产总值(内生产总值(GDPPCGDPPC)是非平稳的是非平稳的。 从滞后从滞后1414期的期的QLB统计量看:统计量看:CPCCPC与与GDPPCGDPPC序列的序列的统计量计算

18、值均为统计量计算值均为57.1857.18,超过了显著性水平为,超过了显著性水平为5%5%时的临界值时的临界值23.6823.68。再次。再次表明它们的非平稳性。表明它们的非平稳性。就此来说,运用传统的回归方法建立它们的就此来说,运用传统的回归方法建立它们的回归方程是无实际意义的。回归方程是无实际意义的。不过,不过,9.39.3中将看到,如果两个非平稳时间中将看到,如果两个非平稳时间序列是协整的,则传统的回归结果却是有意序列是协整的,则传统的回归结果却是有意义的,而这两时间序列恰是协整的。义的,而这两时间序列恰是协整的。 四、平稳性的单位根检验四、平稳性的单位根检验 (unit root te

19、st) 1 1、DFDF检验检验 随机游走序列随机游走序列: Xt=Xt-1+t是非平稳的,其中t是白噪声。而该序列可看成是随机模型: Xt=Xt-1+t中参数=1时的情形。 (* *)式可变形成差分形式:)式可变形成差分形式: Xt=(-1)Xt-1+ t =Xt-1+ t (*)检验(检验(*)式是否存在单位根)式是否存在单位根 =1,也可通过,也可通过(*)式判断是否有)式判断是否有 =0。对式:对式: Xt=Xt-1+t (*) 进行回归,如果确实发现进行回归,如果确实发现 =1,就说随机变量,就说随机变量Xt有一个有一个单位根单位根。一般地一般地: : 检验一个时间序列检验一个时间序

20、列X Xt t的平稳性,可通过检验的平稳性,可通过检验带有截距项的一阶自回归模型:带有截距项的一阶自回归模型: X Xt t= = + + X Xt-1t-1+ + t t (* *)中的参数中的参数 是否小于是否小于1 1。 或者:或者:检验其等价形式:检验其等价形式: X Xt t= = + + X Xt-1t-1+ + t t (*)中的参数中的参数 是否小于是否小于0 0 。 在第二节中将证明,(在第二节中将证明,(*)式中的参数)式中的参数 1或或 =1时,时间序列是非平稳的时,时间序列是非平稳的;对应于(对应于(*)式,则是)式,则是 0或或 =0。 因此,针对式:因此,针对式:

21、Xt= + Xt-1+ t 我们关心的检验为我们关心的检验为:零假设零假设 H0: =0。 备择假设备择假设 H1: 0上述检验可通过上述检验可通过OLS法下的法下的t检验完成。检验完成。然而,在零假设(序列非平稳)下,即使在大样本下然而,在零假设(序列非平稳)下,即使在大样本下t统统计量也是有偏误的(向下偏倚),通常的计量也是有偏误的(向下偏倚),通常的t 检验无法使用。检验无法使用。 Dicky和和Fuller于于1976年提出了这一情形下年提出了这一情形下t统计量服从的统计量服从的分布(这时的分布(这时的t统计量称为统计量称为 统计量统计量),即即DF分布分布(见表(见表9.1.3)。)

22、。首先首先,用用OLS法估计法估计(*)式)式,并计算并计算t统计量统计量,与与DF分布表分布表中给定显著性水平下的临界值比较中给定显著性水平下的临界值比较,如果如果t统计量的值小于统计量的值小于临界值临界值,这意味着这意味着 足够小足够小,拒绝原假设拒绝原假设,认为时间序列不存认为时间序列不存在单位根在单位根,是平稳的是平稳的. 因此,可通过因此,可通过OLS法估计:法估计: X Xt t= = + + X Xt-1t-1+ + t t 并计算并计算t统计量的值,与统计量的值,与DF分布表中给定显著性分布表中给定显著性水平下的临界值比较:水平下的临界值比较: 问题的提出:问题的提出: 在在利

23、利用用 X Xt t= = + + X Xt-1t-1+ + t t对对时时间间序序列列进进行行平平稳稳性性检检验验中中,实实际际上上假假定定了了时时间间序序列列是是由由具具有有白白噪噪声声随机误差项的一阶自回归过程随机误差项的一阶自回归过程AR(1)生成的生成的。 但但在在实实际际检检验验中中,时时间间序序列列可可能能由由更更高高阶阶的的自自回回归归过过程程生生成成的的,或或者者随随机机误误差差项项并并非非是是白白噪噪声声,这这样样用用OLS法法进进行行估估计计均均会会表表现现出出随随机机误误差差项项出出现现自相关自相关(autocorrelation),导致导致DF检验无效。检验无效。 2

24、 2、ADFADF检验检验 另另外外,如如果果时时间间序序列列包包含含有有明明显显的的随随时时间间变变化化的的某某种种趋趋势势(如如上上升升或或下下降降),则则也也容容易易导导致致上上述述检检验验中中的的自自相相关关随随机机误误差差项项问问题题。 为为了了保保证证DF检检验验中中随随机机误误差差项项的的白白噪噪声声特特性性,Dicky和和Fuller对对DF检检验验进进行行了了扩扩充充,形成了形成了ADF(Augment Dickey-Fuller )检验)检验。 ADFADF检验是通过下面三个模型完成的:检验是通过下面三个模型完成的:模型模型3 中的中的t是时间变量是时间变量,代表了时间序列

25、随代表了时间序列随时间变化的某种趋势(如果有的话)。模型时间变化的某种趋势(如果有的话)。模型1与另两模型的差别在于是否包含有常数项和趋与另两模型的差别在于是否包含有常数项和趋势项。势项。 检验的假设都是:针对检验的假设都是:针对H1: 临界值,不能拒绝存临界值,不能拒绝存在单位根的零假设。在单位根的零假设。 时间T的t统计量小于ADF分布表中的临界值,因此不能拒绝不存在趋势项的零假不能拒绝不存在趋势项的零假设设。需进一步检验模型需进一步检验模型2 。 2)经试验,模型)经试验,模型2中滞后项取中滞后项取2阶:阶: LM检检验验表表明明模模型型残残差差不不存存在在自自相相关关性性,因此该模型的

26、设定是正确的。因此该模型的设定是正确的。从从GDPt-1的参数值看,其的参数值看,其t统计量为正值,大统计量为正值,大于临界值于临界值,不能拒绝存在单位根的零假设不能拒绝存在单位根的零假设。常数项的常数项的t统计量小于统计量小于AFD分布表中的临界值分布表中的临界值,不能拒绝不存常数项的零假设。不能拒绝不存常数项的零假设。需进一步检需进一步检验模型验模型1。 3)3)经试验,模型经试验,模型1中滞后项取中滞后项取2阶阶: LM检验表明模型残差项不存在自相关性,检验表明模型残差项不存在自相关性,因此模型的设定是正确的。因此模型的设定是正确的。 从从GDPt-1的参数值看,其的参数值看,其t统计量

27、为正值,大统计量为正值,大于临界值,于临界值,不能拒绝存在单位根的零假设。不能拒绝存在单位根的零假设。 可断定中国支出法可断定中国支出法GDP时间序列是非平稳的。时间序列是非平稳的。例例9.1.7 检验检验2.102.10中关于人均居民消费与人均中关于人均居民消费与人均国内生产总值这两时间序列的平稳性。国内生产总值这两时间序列的平稳性。 1) 对对中中国国人人均均国国内内生生产产总总值值GDPPC来来说说,经过偿试,三个模型的适当形式分别为:经过偿试,三个模型的适当形式分别为: 三三个个模模型型中中参参数数的的估估计计值值的的t统统计计量量均均大大于于各各自自的的临临界界值值,因因此此不不能能

28、拒拒绝绝存存在在单单位位根根的的零假设零假设。 结结论论:人人均均国国内内生生产产总总值值(GDPPC)是是非非平稳的。平稳的。 2 2)对于)对于人均居民消费人均居民消费CPC时间序列来说,三时间序列来说,三个模型的适当形式为个模型的适当形式为 : 三三个个模模型型中中参参数数CPCt-1的的t统统计计量量的的值值均均比比ADF临临界界值值表表中中各各自自的的临临界界值值大大,不不能能拒拒绝绝该时间序列存在单位根的假设该时间序列存在单位根的假设,因因此此,可可判判断断人人均均居居民民消消费费序序列列CPC是是非非平平稳稳的。的。五、单整、趋势平稳与差分平稳随机五、单整、趋势平稳与差分平稳随机

29、过程过程 随随机机游游走走序序列列Xt=Xt-1+ t经经差差分分后后等等价价地地变变形形为为 Xt= t, 由由于于 t是是一一个个白白噪噪声声,因因此此差分后的序列差分后的序列 Xt是平稳的。是平稳的。 如如果果一一个个时时间间序序列列经经过过一一次次差差分分变变成成平平稳稳的的,就就称称原原序序列列是是一一阶阶单单整整(integrated of 1)序序列列,记为,记为I(1)。单整单整一般地,如果一个时间序列经过一般地,如果一个时间序列经过d次差分后变次差分后变成平稳序列,则称原序列是成平稳序列,则称原序列是d 阶单整阶单整(integrated of d)序列序列,记为,记为I(d

30、)。 显然,I(0)代表一平稳时间序列。代表一平稳时间序列。现实经济生活中现实经济生活中:1)只只有有少少数数经经济济指指标标的的时时间间序序列列表表现现为为平平稳稳的的,如利率等如利率等;2)大大多多数数指指标标的的时时间间序序列列是是非非平平稳稳的的,如如一一些些价价格格指指数数常常常常是是2阶阶单单整整的的,以以不不变变价价格格表表示示的的消费额、收入等常表现为消费额、收入等常表现为1阶单整。阶单整。 大大多多数数非非平平稳稳的的时时间间序序列列一一般般可可通通过过一一次次或或多次差分的形式变为平稳的。多次差分的形式变为平稳的。 但但也也有有一一些些时时间间序序列列,无无论论经经过过多多

31、少少次次差差分分,都都不不能能变变为为平平稳稳的的。这这种种序序列列被被称称为为非非单单整整的的(non-integrated)。例例9.1.8 中国支出法中国支出法GDP的单整性。的单整性。经经过过试试算算,发发现现中中国国支支出出法法GDP是是1阶阶单单整整的的,适当的检验模型为:适当的检验模型为:例例9.1.9 中中国国人人均均居居民民消消费费与与人人均均国国内内生生产产总总值的单整性。值的单整性。 经经过过试试算算,发发现现中中国国人人均均国国内内生生产产总总值值GDPPC是是2阶单整的阶单整的,适当的检验模型为:适当的检验模型为: 同样地同样地,CPC也是也是2阶单整的阶单整的,适当

32、适当的检验模型为:的检验模型为: 趋势平稳与差分平稳随机过程趋势平稳与差分平稳随机过程 前前文文已已指指出出,一一些些非非平平稳稳的的经经济济时时间间序序列列往往往往表表现现出出共共同同的的变变化化趋趋势势,而而这这些些序序列列间间本本身身不不一一定定有有直直接接的的关关联联关关系系,这这时时对对这这些些数数据据进进行行回回归归,尽尽管管有有较较高高的的R2,但但其其结结果果是是没没有有任任何何实实际际意意义义的的。这这种种现现象象我我们们称称之之为为虚虚假假回回归归或或伪回归伪回归(spurious regression)。 如如:用用中中国国的的劳劳动动力力时时间间序序列列数数据据与与美美

33、国国GDP时时间间序序列列作作回回归归,会会得得到到较较高高的的R2 ,但但不不能能认认为为两两者者有有直直接接的的关关联联关关系系,而而只只不不过过它它们们有有共共同同的的趋趋势势罢罢了了,这这种种回回归归结结果果我我们们认认为为是虚假的。是虚假的。 为为了了避避免免这这种种虚虚假假回回归归的的产产生生,通通常常的的做做法法是是引引入入作作为为趋趋势势变变量量的的时时间间,这这样样包包含含有有时时间间趋势变量的回归,可以消除这种趋势性的影响。趋势变量的回归,可以消除这种趋势性的影响。 然然而而这这种种做做法法,只只有有当当趋趋势势性性变变量量是是确确定定 性性 的的 ( determinis

34、tic) 而而 非非 随随 机机 性性 的的(stochastic),才会是有效的。才会是有效的。 换换言言之之,如如果果一一个个包包含含有有某某种种确确定定性性趋趋势势的的非非平平稳稳时时间间序序列列,可可以以通通过过引引入入表表示示这这一一确确定定性性趋趋势势的的趋趋势势变变量量,而而将将确确定定性性趋趋势势分分离离出出来。来。 1)如如果果=1,=0,则则(*)式式成成为为一一带带位位移移的的随机游走过程随机游走过程: Xt=+Xt-1+t (*) 根根据据 的的正正负负,Xt表表现现出出明明显显的的上上升升或或下下降降趋趋势势。这这种种趋趋势势称称为为随随机机性性趋趋势势(stocha

35、stic trend)。考虑如下的含有一阶自回归的随机过程:考虑如下的含有一阶自回归的随机过程: Xt= + t+ Xt-1+ t (*) 其中其中: t是一白噪声,是一白噪声,t为一时间趋势。为一时间趋势。2)如如果果 =0,0,则(*)式式成成为为一一带带时时间间趋趋势势的随机变化过程:的随机变化过程: Xt=+t+t (*) 根根据据 的的正正负负,Xt表表现现出出明明显显的的上上升升或或下下降降趋趋势势 。 这这 种种 趋趋 势势 称称 为为 确确 定定 性性 趋趋 势势(deterministic trend)。 3) 如果如果 =1,0,则,则XtXt包含有包含有确定性与随机确定性

36、与随机性两种趋势。性两种趋势。 判判断断一一个个非非平平稳稳的的时时间间序序列列,它它的的趋趋势势是是随随机机性性的的还还是是确确定定性性的的,可可通通过过ADF检检验验中中所所用的第用的第3个模型进行。个模型进行。 该该模模型型中中已已引引入入了了表表示示确确定定性性趋趋势势的的时时间间变量变量t,即分离出了确定性趋势的影响。,即分离出了确定性趋势的影响。因此因此: (1)如果检验结果表明所给时间序列有单位如果检验结果表明所给时间序列有单位根,且时间变量前的参数显著为零,则该序根,且时间变量前的参数显著为零,则该序列显示出随机性趋势列显示出随机性趋势; (2)如果没有单位根,且时间变量前的参

37、数如果没有单位根,且时间变量前的参数显著地异于零,则该序列显示出确定性趋势。显著地异于零,则该序列显示出确定性趋势。 随机性趋势可通过差分的方法消除随机性趋势可通过差分的方法消除例如:对式:例如:对式:Xt=+Xt-1+t 可通过差分变换为:可通过差分变换为: Xt= +t 该时间序列称为该时间序列称为差分平稳过程(差分平稳过程(difference stationary process);确定性趋势无法通过差分的方法消除,而只能确定性趋势无法通过差分的方法消除,而只能通过除去趋势项消除通过除去趋势项消除例如:对式:例如:对式:Xt=+t+t可通过除去可通过除去 t变换为:变换为:Xt t =

38、+t该时间序列是平稳的,因此称为该时间序列是平稳的,因此称为趋势平稳过程趋势平稳过程(trend stationary process)。)。 最后需要说明的是,最后需要说明的是,趋势平稳过程代表了趋势平稳过程代表了一个时间序列长期稳定的变化过程,因而用于一个时间序列长期稳定的变化过程,因而用于进行长期预测则是更为可靠的。进行长期预测则是更为可靠的。 9.2 9.2 随机时间序列分析模型随机时间序列分析模型一、一、时间序列模型的基本概念及其适用性时间序列模型的基本概念及其适用性二、二、随机时间序列模型的平稳性条件随机时间序列模型的平稳性条件三、三、随机时间序列模型的识别随机时间序列模型的识别四

39、、四、随机时间序列模型的估计随机时间序列模型的估计五、五、随机时间序列模型的检验随机时间序列模型的检验说明说明经典计量经济学模型与时间序列模型经典计量经济学模型与时间序列模型确定性时间序列模型与随机性时间序列模型确定性时间序列模型与随机性时间序列模型一、时间序列模型的基本概念及其一、时间序列模型的基本概念及其适用性适用性1 1、时间序列模型的基本概念、时间序列模型的基本概念 随随机机时时间间序序列列模模型型(time series modeling)是是指指仅仅用用它它的的过过去去值值及及随随机机扰扰动动项项所所建建立立起起来的模型,其一般形式为来的模型,其一般形式为: Xt=F(Xt-1,

40、Xt-2, , t) 建建立立具具体体的的时时间间序序列列模模型型,需需解解决决如如下下三三个问题:个问题: (1)模型的具体形式模型的具体形式 (2)时序变量的滞后期时序变量的滞后期 (3)随机扰动项的结构随机扰动项的结构 例例如如,取取线线性性方方程程、一一期期滞滞后后以以及及白白噪噪声声随随机机扰扰动动项项( t = t),模模型型将将是是一一个个1阶阶自自回回归归过过程程AR(1): Xt=Xt-1+ t,这这里里, t特特指指一白噪声一白噪声。 一般的p阶自回归过程阶自回归过程AR(p)是 Xt=1Xt-1+ 2Xt-2 + + pXt-p + t (*) (1)如如 果果 随随 机

41、机 扰扰 动动 项项 是是 一一 个个 白白 噪噪 声声( t= t),则则称称(*)式式为为一一纯纯AR(p)过过程程(pure AR(p) process),记为记为: Xt=1Xt-1+ 2Xt-2 + + pXt-p +t (2)如果如果 t不是一个白噪声,通常认为不是一个白噪声,通常认为它是一个它是一个q阶的阶的移动平均(移动平均(moving average)过程)过程MA(q): t=t - 1t-1 - 2t-2 - - qt-q 该式给出了一个纯该式给出了一个纯MA(q)过程(过程(pure MA(p) process)。 将纯将纯AR(pAR(p) )与纯与纯MA(qMA(

42、q) )结合,得到一个一般的结合,得到一个一般的自自回归移动平均(回归移动平均(autoregressive moving average)过程过程ARMA(p,q): Xt=1Xt-1+ 2Xt-2 + + pXt-p + t - 1t-1 - 2t-2 - - qt-q 该式表明:该式表明:(1)一一个个随随机机时时间间序序列列可可以以通通过过一一个个自自回回归归移移动动平平均均过过程程生生成成,即即该该序序列列可可以以由由其其自自身身的的过过去去或滞后值以及随机扰动项来解释。或滞后值以及随机扰动项来解释。(2)如果该序列是平稳的)如果该序列是平稳的,即它的行为并不会即它的行为并不会随着时

43、间的推移而变化,随着时间的推移而变化,那么我们就可以通那么我们就可以通过该序列过去的行为来预测未来。过该序列过去的行为来预测未来。 这也正是随机时间序列分析模型的优势这也正是随机时间序列分析模型的优势所在。所在。经典回归模型的问题:经典回归模型的问题: 迄迄今今为为止止,对对一一个个时时间间序序列列Xt的的变变动动进进行行解解释释或或预预测测,是是通通过过某某个个单单方方程程回回归归模模型型或或联联立立方方程程回回归归模模型型进进行行的的,由由于于它它们们以以因因果果关关系系为为基基础础,且且具具有有一一定定的的模模型型结结构构,因因此此也也常常称为称为结构式模型(结构式模型(structur

44、al model)。 2 2、时间序列分析模型的适用性、时间序列分析模型的适用性 然然而而,如如果果Xt波波动动的的主主要要原原因因可可能能是是我我们们无无法法解解释释的的因因素素,如如气气候候、消消费费者者偏偏好好的的变变化化等等,则则利利用用结结构构式式模模型型来来解解释释Xt的的变变动动就就比比较较困困难难或或不不可可能能,因因为为要要取取得得相相应应的的量量化化数数据据,并并建建立令人满意的回归模型是很困难的。立令人满意的回归模型是很困难的。 有有时时,即即使使能能估估计计出出一一个个较较为为满满意意的的因因果果关关系系回回归归方方程程,但但由由于于对对某某些些解解释释变变量量未未来来

45、值值的的预预测测本本身身就就非非常常困困难难,甚甚至至比比预预测测被被解解释释变变量量的的未未来来值值更更困困难难,这这时时因因果果关关系系的的回回归归模模型型及其预测技术就不适用了。及其预测技术就不适用了。 例例如如,时时间间序序列列过过去去是是否否有有明明显显的的增增长长趋趋势势,如如果果增增长长趋趋势势在在过过去去的的行行为为中中占占主主导导地地位位,能能否否认为它也会在未来的行为里占主导地位呢?认为它也会在未来的行为里占主导地位呢? 或或者者时时间间序序列列显显示示出出循循环环周周期期性性行行为为,我我们们能否利用过去的这种行为来外推它的未来走向?能否利用过去的这种行为来外推它的未来走

46、向? 另一条预测途径另一条预测途径:通过时间序列的历史数据,得出关于其过去行为的有关结论,进而对时间序列未来行为进行推断。随随机机时时间间序序列列分分析析模模型型,就就是是要要通通过过序序列列过过去去的变化特征来预测未来的变化趋势的变化特征来预测未来的变化趋势。 使使用用时时间间序序列列分分析析模模型型的的另另一一个个原原因因在在于于:如果经济理论正确地阐释了现实经济结构,则这一结构可以写成类似于ARMA(p,q)式的时间序列分析模型的形式。 例如,例如,对于如下最简单的宏观经济模型:对于如下最简单的宏观经济模型: 这这里里,Ct、It、Yt分分别别表表示示消消费费、投投资资与与国国民民收收入

47、。入。 Ct与与Yt作作为为内内生生变变量量,它它们们的的运运动动是是由由作作为为外外生生变变量量的的投投资资It的的运运动动及及随随机机扰扰动动项项 t的的变变化决定的。化决定的。上述模型可作变形如下上述模型可作变形如下: 两两个个方方程程等等式式右右边边除除去去第第一一项项外外的的剩剩余余部部分分可可看看成成一一个个综综合合性性的的随随机机扰扰动动项项,其其特特征征依依赖于投资项赖于投资项It的行为。的行为。 如如果果It是是一一个个白白噪噪声声,则消费序列Ct就成为一个1阶阶自自回回归归过过程程AR(1),而收入序列Yt就成为一个(1,1)阶阶的的自自回回归归移移动动平平均均过程过程AR

48、MA(1,1)。二、随机时间序列模型的平稳性条件二、随机时间序列模型的平稳性条件 自自回回归归移移动动平平均均模模型型(ARMA)是是随随机机时时间间序序列列分分析析模模型型的的普普遍遍形形式式,自自回回归归模模型型(AR)和和移移动动平平均均模模型型(MA)是是它它的的特特殊殊情情况。况。 关关于于这这几几类类模模型型的的研研究究,是是时时间间序序列列分分析析的的重重点点内内容容:主主要要包包括括模模型型的的平平稳稳性性分分析析、模模型的识别型的识别和和模型的估计模型的估计。 1 1、AR(pAR(p) )模型的平稳性条件模型的平稳性条件 随机时间序列模型的平稳性随机时间序列模型的平稳性,可

49、通过它所可通过它所生成的随机时间序列的平稳性来判断生成的随机时间序列的平稳性来判断。如果如果一个p阶自回归模型阶自回归模型AR(p)生成的时间序列是平稳生成的时间序列是平稳的,就说该的,就说该AR(p)模型是平稳的。模型是平稳的。 否则,就说该否则,就说该AR(p)模型是非平稳的。模型是非平稳的。 考虑考虑p阶自回归模型阶自回归模型AR(p) Xt=1Xt-1+ 2Xt-2 + + pXt-p +t (*)引入引入滞后算子(滞后算子(lag operator )L: LXt=Xt-1, L2Xt=Xt-2, , LpXt=Xt-p(*)(*)式变换为式变换为: (1-1L- 2L2-pLp)X

50、t=t 记(L)= (1-1L- 2L2- - pL p ),则称多项式方则称多项式方程:程: (z)= (1-1z- 2z2-pzp)=0为为AR(p)的的特征方程特征方程(characteristic equation)。 可以证明,如果该特征方程的所有根在可以证明,如果该特征方程的所有根在单位圆外(根的模大于单位圆外(根的模大于1),则),则AR(p)模型是模型是平稳的。平稳的。 例例9.2.1 AR(1)模型的平稳性条件。模型的平稳性条件。对对1阶自回归模型阶自回归模型AR(1)方程两边平方再求数学期望,得到方程两边平方再求数学期望,得到Xt的方差:的方差: 由由于于Xt仅仅与与 t相

51、相关关,因因此此,E(Xt-1 t)=0。如如果果该该模模型型稳稳定定,则则有有E(Xt2)=E(Xt-12),从从而而上上式式可变换为:可变换为:在稳定条件下,该方差是一非负的常数,从而有在稳定条件下,该方差是一非负的常数,从而有 |1。 而而AR(1)的特征方程:的特征方程:的根为:的根为: z=1/ AR(1)稳定,即稳定,即 | | 1,意味着特征根大于,意味着特征根大于1。例例9.2.2 AR(2)模型的平稳性。模型的平稳性。 对对AR(2)模型:模型: 方程两边同乘以方程两边同乘以XtXt,再取期望得:,再取期望得: 又由于:又由于:于是于是: 同样地,由原式还可得到同样地,由原式

52、还可得到:于是方差为于是方差为 : 由由平平稳稳性性的的定定义义,该该方方差差必必须须是是一一不不变变的的正正数,于是有数,于是有 1+ 21, 2- 11, | 2|1 这就是这就是AR(2)的平稳性条件的平稳性条件,或称为平稳域平稳域。它是一顶点分别为(它是一顶点分别为(-2,-1),(),(2,-1),(),(0,1)的)的三角形三角形。 对应的特征方程对应的特征方程1-1- 1 1z-z- 2 2z z2 2=0=0 的两个根的两个根z z1 1、z z2 2满足:满足: z z1 1z z2 2=-1/=-1/ 2 2 , , z z1 1+z+z2 2 =-=- 1 1/ / 2

53、2 AR(2)模型模型:解出解出 1 1, 2 2:由由AR(2)的的平平稳稳性性,| 2 2|=1/|z z1 1|z|z2 2|1,有:,有:于是于是| z z2 2 |1。由。由 2 2 - - 1 1 1可推出同样的结果。可推出同样的结果。 对高阶自回模型对高阶自回模型AR(p)来说来说,多数情况下没多数情况下没有必要直接计算其特征方程的特征根,但有有必要直接计算其特征方程的特征根,但有一些一些有用的规则可用来检验高阶自回归模型的稳定性有用的规则可用来检验高阶自回归模型的稳定性: (1)AR(p)模型稳定的必要条件是模型稳定的必要条件是: 1+2+p1 (2)(2)由于由于 i i(i

54、(i=1,2,=1,2,p)p)可正可负可正可负,AR(p)模型模型稳定的充分条件是:稳定的充分条件是: |1|+|2|+|p|1 对于移动平均模型对于移动平均模型MR(q): Xt=t - 1t-1 - 2t-2 - - qt-q 其中其中 t是一个白噪声,于是:是一个白噪声,于是: 2、MA(q)模型的平稳性模型的平稳性 当滞后期大于当滞后期大于q时,时,XtXt的自协方差系数为的自协方差系数为0。因此因此: :有限阶移动平均模型总是平稳的有限阶移动平均模型总是平稳的。 由于由于ARMA (p,q)模型是模型是AR(p)模型与模型与MA(q)模型的组合:模型的组合:Xt= 1Xt-1+ 2

55、Xt-2 + + pXt-p + t - 1t-1 - 2t-2 - - qt-q 3、ARMA(p,q)模型的平稳性模型的平稳性 而而MA(q)模型总是平稳的,因此模型总是平稳的,因此ARMA (p,q)模型的平稳性取决于模型的平稳性取决于AR(p)部分的平稳性。部分的平稳性。 当当AR(p)部分平稳时,则该部分平稳时,则该ARMA(p,q)模型模型是平稳的,否则,不是平稳的。是平稳的,否则,不是平稳的。 4、总结、总结 (1 1)一个平稳的时间序列总可以找到生成)一个平稳的时间序列总可以找到生成它的平稳的随机过程或模型;它的平稳的随机过程或模型; (2 2)一个非平稳的随机时间序列通常可以

56、)一个非平稳的随机时间序列通常可以通过差分的方法将它变换为平稳的,对差分后通过差分的方法将它变换为平稳的,对差分后平稳的时间序列也可找出对应的平稳随机过程平稳的时间序列也可找出对应的平稳随机过程或模型。或模型。 因此,因此,如果我们将一个非平稳时间序列通如果我们将一个非平稳时间序列通过过d d次差分,将它变为平稳的,然后用一个平次差分,将它变为平稳的,然后用一个平稳的稳的ARMA(p,qARMA(p,q) )模型作为它的生成模型,则我模型作为它的生成模型,则我们就说该原始时间序列是一个们就说该原始时间序列是一个自回归单整移动自回归单整移动平均(平均(autoregressive integra

57、ted moving autoregressive integrated moving averageaverage)时间序列,记为)时间序列,记为ARIMA(p,d,qARIMA(p,d,q) )。 例如,例如,一个一个ARIMA(2,1,2)ARIMA(2,1,2)时间序列在它成时间序列在它成为平稳序列之前先得差分一次,然后用一个为平稳序列之前先得差分一次,然后用一个ARMA(2,2)ARMA(2,2)模型作为它的生成模型的。模型作为它的生成模型的。 当然,当然,一个一个ARIMA(p,0,0)ARIMA(p,0,0)过程表示了一个纯过程表示了一个纯AR(pAR(p) )平稳过程;一个平稳

58、过程;一个ARIMA(0,0,q)ARIMA(0,0,q)表示一个表示一个纯纯MA(qMA(q) )平稳过程。平稳过程。三、随机时间序列模型的识别三、随机时间序列模型的识别 所所谓谓随随机机时时间间序序列列模模型型的的识识别别,就就是是对对于于一一个个平平稳稳的的随随机机时时间间序序列列,找找出出生生成成它它的的合合适适的的随随机机过过程程或或模模型型,即判断该时间序列是遵循一纯AR过程、还是遵循一纯MA过程或ARMA过程。 所所使使用用的的工工具具主要是时时间间序序列列的的自自相相关关函函数数(autocorrelation function,ACF)及及偏偏自自相相关关 函函 数数 ( p

59、artial autocorrelation function, PACF )。)。 1 1、AR(pAR(p) )过程过程 (1)(1)自相关函数自相关函数ACFACF 1阶自回归模型阶自回归模型AR(1): Xt=Xt-1+ t 的k阶滞后自协方差自协方差为:=1,2,因此,因此,AR(1)模型的模型的自相关函数自相关函数为: =1,2, 由由AR(1)的稳定性知的稳定性知| | |1,因此,因此,k k时,时,呈指数形衰减,直到零呈指数形衰减,直到零。这种现象称为这种现象称为拖尾拖尾或称或称AR(1)有无穷记忆有无穷记忆(infinite memory)。 注意注意, 0时,呈振荡衰减状

60、时,呈振荡衰减状。 Xt=1Xt-1+ 2Xt-2 + t 该模型的方差该模型的方差 0 0以及滞后以及滞后1期与期与2期的自协方期的自协方差差 1 1, , 2 2分别为:分别为: 阶自回归模型阶自回归模型AR(2) 类似地类似地, ,可写出一般的可写出一般的k期滞后自协方差期滞后自协方差: (K=2,3,)于是于是, ,AR(2)的的k 阶自相关函数阶自相关函数为为: (K=2,3,)其中其中 : 1= 1/(1- 2), 0=1如果如果AR(2)AR(2)稳定,则由稳定,则由 1 1+ + 2 211知知| | k k| |衰减趋衰减趋于零,呈拖尾状。于零,呈拖尾状。 至于衰减的形式,要

61、看至于衰减的形式,要看AR(2)AR(2)特征根的实特征根的实虚性,虚性,若为实根,则呈单调或振荡型衰减,若若为实根,则呈单调或振荡型衰减,若为虚根,则呈正弦波型衰减。为虚根,则呈正弦波型衰减。 一般地一般地,p阶自回归模型阶自回归模型AR(p): Xt=1Xt-1+ 2Xt-2 + pXt-p + tk期滞后协方差为期滞后协方差为: 从而有从而有自相关函数自相关函数 : 可见,无论无论k k有多大,有多大, k k的计算均与其到的计算均与其到p p阶滞后的自相关函数有关阶滞后的自相关函数有关,因此呈拖尾状呈拖尾状。 如果如果AR(pAR(p) )是稳定的,则是稳定的,则| | k k| |递

62、减且趋于零递减且趋于零。 事实上,自相关函数事实上,自相关函数:是一是一p阶差分方程,其通解为:阶差分方程,其通解为: 其其中中:1/zi是是AR(p)特特征征方方程程 (z)=0的的特特征征根,由根,由AR(p)平稳的条件知,平稳的条件知,|zi|p,Xt与Xt-k间的间的偏自相关系数偏自相关系数为零为零。 AR(p)的一个主要特征是的一个主要特征是:kp时,时, k*=Corr(Xt,Xt-k)=0 即即 k*在在p以后是截尾的。以后是截尾的。一随机时间序列的识别原则:一随机时间序列的识别原则:若若XtXt的的偏偏自自相相关关函函数数在在p p以以后后截截尾尾,即即kp时时, k*=0=0

63、,而而它它的的自自相相关关函函数数 k是是拖拖尾尾的的,则则此此序序列是自回归列是自回归AR(pAR(p) )序列。序列。 在实际识别时,由于样本偏自相关函数在实际识别时,由于样本偏自相关函数r rk k* *是总体偏自相关函数是总体偏自相关函数 k k* *的一个估计,由于的一个估计,由于样本的随机性,当样本的随机性,当kp时,时,r rk k* *不会全为不会全为0,而,而是在是在0的上下波动。但可以证明,当的上下波动。但可以证明,当kp时,时,r rk k* *服从如下渐近正态分布服从如下渐近正态分布: : rk*N(0,1/n)式中式中n表示样本容量。表示样本容量。 需指出的是需指出的

64、是,我们就有我们就有95.5%的把握判断原时间序列在的把握判断原时间序列在p p之后之后截尾。截尾。因此,如果计算的因此,如果计算的rk*满足:满足: 对对MA(1)过程过程:2、MA(qMA(q) )过程过程 可容易地写出它的可容易地写出它的自协方差系数自协方差系数: 于是,于是,MA(1)过程的过程的自相关函数自相关函数为为:可见,当当k1时,时, k0,即,即Xt与与Xt-k不相关,不相关,MA(1)自相关函数是截尾的。自相关函数是截尾的。 MA(1)过程可以等价地写成过程可以等价地写成 t关于无穷序列关于无穷序列Xt,Xt-1,的线性组合的形式:的线性组合的形式:或或:(*) (*)是

65、一个是一个AR(AR( ) )过程,它的偏自相关函数过程,它的偏自相关函数非截尾但却趋于零,因此非截尾但却趋于零,因此MA(1)MA(1)的偏自相关函数的偏自相关函数是非截尾但却趋于零的。是非截尾但却趋于零的。 注意注意: : (*)式只有当式只有当| |1时才有意义,否则意味着时才有意义,否则意味着距距XtXt越远的越远的X值,对值,对XtXt的影响越大,显然不符合的影响越大,显然不符合常理。常理。 因此,我们因此,我们把把| | |1|q时时, Xt与与Xt-k不不相相关关,即即存存在在截截尾尾现现象象,因因此此,当当kq时时, k k=0是是MA(q)的的一个特征一个特征。 于于是是:可

66、可以以根根据据自自相相关关系系数数是是否否从从某某一一点点开开始一直为始一直为0 0来判断来判断MA(qMA(q) )模型的阶。模型的阶。 与与MA(1)相仿,可以验证相仿,可以验证MA(q)过程的偏自相过程的偏自相关函数是非截尾但趋于零的。关函数是非截尾但趋于零的。 MA(q)模型的识别规则:模型的识别规则:若随机序列的自相若随机序列的自相关函数截尾,即自关函数截尾,即自q q以后,以后, k k=0=0( kqkq);而它);而它的偏自相关函数是拖尾的,则此序列是滑动平均的偏自相关函数是拖尾的,则此序列是滑动平均MA(qMA(q) )序列。序列。 同样需要注意的是同样需要注意的是:在实际识

67、别时,由于样在实际识别时,由于样本自相关函数本自相关函数r rk k是总体自相关函数是总体自相关函数 k k的一个估计,的一个估计,由于样本的随机性,当由于样本的随机性,当kq时,时,r rk k不会全为不会全为0,而,而是在是在0的上下波动。但可以证明,当的上下波动。但可以证明,当kq时,时,r rk k服服从如下渐近正态分布从如下渐近正态分布: :rkN(0,1/n)式中式中n表示样本容量。表示样本容量。 因此因此,如果计算的如果计算的rk满足:满足:我们就有就有95.5%95.5%的把握判断原时间序列在的把握判断原时间序列在q q之后之后截尾截尾。 ARMA(p,q)的自相关函数的自相关

68、函数,可以看作可以看作MA(q)的自相关函数和的自相关函数和AR(p)的自相关函数的混的自相关函数的混合物。合物。 当当p=0时,它具有截尾性质时,它具有截尾性质; 当当q=0时,它具有拖尾性质;时,它具有拖尾性质; 当当p、q都不为都不为0时,它具有拖尾性质时,它具有拖尾性质3 3、ARMA(pARMA(p, q), q)过程过程 从识别上看,通常:从识别上看,通常: ARMA(p,q)过程的偏自相关函数过程的偏自相关函数(PACF)可能在可能在p阶滞后前有几项明显的尖阶滞后前有几项明显的尖柱(柱(spikes),但从),但从p阶滞后项开始逐渐趋向阶滞后项开始逐渐趋向于零;于零; 而而它的自

69、相关函数(它的自相关函数(ACF)则是在则是在q阶阶滞后前有几项明显的尖柱,从滞后前有几项明显的尖柱,从q阶滞后项开阶滞后项开始逐渐趋向于零。始逐渐趋向于零。 四、随机时间序列模型的估计四、随机时间序列模型的估计 AR(p)、MA(q)、ARMA(p,q)模模型型的的估估计计方方法法较多,较多,大体上分为大体上分为3类:类: (1)最小二乘估计;)最小二乘估计; (2)矩估计;)矩估计; (3)利用自相关函数的直接估计)利用自相关函数的直接估计。 下面有选择地加以介绍。下面有选择地加以介绍。结构阶数模型识别确定估计参数 AR(pAR(p) )模型的模型的Yule WalkerYule Walk

70、er方程估计方程估计 在在AR(p)模型的识别中,曾得到:模型的识别中,曾得到: 利用利用 k k= = -k-k,得到如下方程组,得到如下方程组: 此方程组被称为此方程组被称为Yule Walker方程组方程组。该方该方程组建立了程组建立了AR(pAR(p) )模型的模型参数模型的模型参数 1 1, , 2 2, , , p p与自相关函数与自相关函数 1 1, , 2 2, , , p p的关系,的关系, 利利用用实实际际时时间间序序列列提提供供的的信信息息,首首先先求求得得自自相关函数的估计值:相关函数的估计值: 然后然后利用利用Yule Walker方程组,求解模型参数方程组,求解模型

71、参数的估计值:的估计值: 由于:由于: 于是于是, , 从而可得从而可得 2 2的估计值的估计值 在具体计算时在具体计算时,可用样本自相关函数可用样本自相关函数r rk k替代。替代。 MA(qMA(q) )模型的矩估计模型的矩估计 将将MA(q)模型的自协方差函数中的各个量用模型的自协方差函数中的各个量用估计量代替,得到:估计量代替,得到: (*) 首先首先求得自协方差函数的估计值,求得自协方差函数的估计值,(*)是一是一个包含个包含(q+1)个待估参数个待估参数 的非线性方程组,可以用的非线性方程组,可以用直接法直接法或或迭代法迭代法求解。求解。 常常用用的的迭迭代代方方法法有有线线性性迭

72、迭代代法法和和Newton-Raphsan迭代法迭代法。 (1 1)MA(1)MA(1)模型的直接算法模型的直接算法 对于对于MA(1)模型,(模型,(*)式相应地写成:)式相应地写成:于是:于是: 或:或:有:有:于是有解:于是有解: 由于参数估计有两组解,可根据可逆性条由于参数估计有两组解,可根据可逆性条件件| 1|1q1的的MA(qMA(q) )模型,一般用迭代算法估计参模型,一般用迭代算法估计参数:数: 由(由(* *)式得)式得 (*)第一步第一步,给出,给出的一组初值,比如的一组初值,比如, ,代入(代入(*)式,计算出第一次迭代值)式,计算出第一次迭代值 , 第二步第二步,将第一

73、次迭代值代入(,将第一次迭代值代入(*)式,计算)式,计算出第二次迭代值出第二次迭代值 按此反复迭代下去,直到第按此反复迭代下去,直到第m步的迭代值步的迭代值与第与第m-1步的迭代值相差不大时(满足一定的精步的迭代值相差不大时(满足一定的精度),便停止迭代,并用第度),便停止迭代,并用第m步的迭代结果作步的迭代结果作为(为(*)的近似解。)的近似解。 ARMA(p,qARMA(p,q) )模型的矩估计模型的矩估计 在在ARMA(p,q)中中共共有有(p+q+1)个个待待估估参参数数1,2,p与1,2,q以及2,其其估估计计量计算步骤及公式如下:量计算步骤及公式如下: 第一步第一步,估计1,2,

74、p 是总体自相关函数的估计值,可用样本自相关是总体自相关函数的估计值,可用样本自相关函数函数rk代替。代替。 第二步,第二步,改写模型,求改写模型,求 1, 2, q以及以及 2的估的估计值计值 将模型:将模型: 改写为:改写为: 令令, 于是于是(*)可以写成可以写成: (*) 构成一个构成一个MA模型。按照估计模型。按照估计MA模型参数模型参数的方法,可以得到的方法,可以得到 1, 2, q以及以及 2的估计值。的估计值。 AR(pAR(p) )的最小二乘估计的最小二乘估计 假设模型假设模型AR(p)的参数估计值已经得到,即有,的参数估计值已经得到,即有, 残差的平方和为:残差的平方和为:

75、 (*) 根据最小二乘原理,所要求的参数估计根据最小二乘原理,所要求的参数估计值是下列方程组的解:值是下列方程组的解: 即 ,j=1,2,p (*) 解该方程组,就可得到待估参数的估计值。解该方程组,就可得到待估参数的估计值。 为了与为了与AR(p)模型的模型的Yule Walker方程估计进行方程估计进行比较,将比较,将(*)改写成:改写成: j=1,2,p由自协方差函数的定义,并用自协方差函数的由自协方差函数的定义,并用自协方差函数的估计值估计值 。代入,上式表示的方程组即为:代入,上式表示的方程组即为: 或或 ,j=1,2,pj=1,2,p解该方程组,得到:解该方程组,得到: 即为参数的

76、最小二乘估计。即为参数的最小二乘估计。 Yule WalkerYule Walker方程组的解:方程组的解: 比较发现,当比较发现,当n足够大时,二者是相似的。足够大时,二者是相似的。 2的估计值为:的估计值为: 需要说明的是,在上述模型的平稳性、识别需要说明的是,在上述模型的平稳性、识别与估计的讨论中,与估计的讨论中,ARMA(p,q)模型中均未包含常模型中均未包含常数项。数项。 如果包含常数项,该常数项并不影响模型如果包含常数项,该常数项并不影响模型的原有性质的原有性质,因为通过适当的变形,可将包含常数项的模型转换为不含常数项的模型。 下面以一般的下面以一般的ARMA(p,q)模型为例说明

77、。模型为例说明。 对含有常数项的模型对含有常数项的模型 :方程两边同减方程两边同减 /(1-/(1- 1 1- - - p p) ),则可得到:,则可得到: 其中,其中,五、模型的检验五、模型的检验 由于由于ARMA(p,q)模型的识别与估计是在假设模型的识别与估计是在假设随机扰动项是一白噪声的基础上进行的,因此随机扰动项是一白噪声的基础上进行的,因此,如果估计的模型确认正确的话,残差应代表一白如果估计的模型确认正确的话,残差应代表一白噪声序列噪声序列。 如果通过所估计的模型计算的样本残差不代如果通过所估计的模型计算的样本残差不代表一白噪声,则说明模型的识别与估计有误,需表一白噪声,则说明模型

78、的识别与估计有误,需重新识别与估计。重新识别与估计。 在实际检验时,主要检验残差序列是否存在在实际检验时,主要检验残差序列是否存在自相关自相关。1 1、残差项的白噪声检验、残差项的白噪声检验 可用可用QLB的统计量进行的统计量进行 2检验检验:在给定显在给定显著性水平下,可计算不同滞后期的著性水平下,可计算不同滞后期的QLB值,通值,通过与过与 2分布表中的相应临界值比较,来检验是分布表中的相应临界值比较,来检验是否拒绝残差序列为白噪声的假设。否拒绝残差序列为白噪声的假设。 若大于相应临界值,则应拒绝所估计的模若大于相应临界值,则应拒绝所估计的模型,需重新识别与估计。型,需重新识别与估计。 2

79、 2、AICAIC与与SBCSBC模型选择标准模型选择标准 另外一个遇到的问题是,在实际识别另外一个遇到的问题是,在实际识别ARMA(p,q)模型时,需多次反复偿试,有可能存模型时,需多次反复偿试,有可能存在不止一组(在不止一组(p,q)值都能通过识别检验。)值都能通过识别检验。 显然,显然,增加增加p与与q的阶数,可增加拟合优度的阶数,可增加拟合优度,但却同时降低了自由度但却同时降低了自由度。 因此因此,对可能的适当的模型,存在着模型对可能的适当的模型,存在着模型的的“简洁性简洁性”与模型的拟合优度的权衡选择问题。与模型的拟合优度的权衡选择问题。 其其中中,n为为待待估估参参数数个个数数(p

80、+q+可可能能存存在在的的常常数数项项),T为为可可使使用用的的观观测测值值,RSS为为残残差差平平方和(方和(Residual sum of squares)。)。 常用的模型选择的判别标准有:常用的模型选择的判别标准有:赤池信息赤池信息法法(Akaike information criterion,简记为简记为AIC)与施瓦兹贝叶斯法施瓦兹贝叶斯法(Schwartz Bayesian criterion,简简记为记为SBC):在选择可能的模型时,在选择可能的模型时,AIC与与SBC越小越好越小越好 显然,如果添加的滞后项没有解释能力,显然,如果添加的滞后项没有解释能力,则对则对RSS值的减

81、小没有多大帮助,却增加待估值的减小没有多大帮助,却增加待估参数的个数,因此使得参数的个数,因此使得AIC或或SBC的值增加。的值增加。 需注意的是:需注意的是:在不同模型间进行比较时,必须选取相同的时间段。 由由第第一一节节知知:中中国国支支出出法法GDP是是非非平平稳稳的的,但但它它的的一一阶阶差差分分是是平平稳稳的的,即即支支出出法法GDP是是I(1)时间序列。时间序列。 可可以以对对经经过过一一阶阶差差分分后后的的GDP建建立立适适当当的的ARMA(p,q)模型。模型。 记记GDP经经一一阶阶差差分分后后的的新新序序列列为为GDPD1,该该新新序序列列的的样样本本自自相相关关函函数数图图

82、与与偏偏自自相相关关函函数数图如下:图如下: 例例9.2.3 中国支出法中国支出法GDP的的ARMA(p,q)模型估计模型估计 图形:样本自相关函数图形呈正弦线型衰减图形:样本自相关函数图形呈正弦线型衰减波,而偏自相关函数图形则在滞后两期后迅速趋波,而偏自相关函数图形则在滞后两期后迅速趋于于0。因此。因此可初步判断该序列满足可初步判断该序列满足2阶自回归过程阶自回归过程AR(2)。 自相关函数自相关函数与与偏自相关函数偏自相关函数的的函数值:函数值: 相关函数具有明显的拖尾性;相关函数具有明显的拖尾性; 偏自相关函数值在偏自相关函数值在k2以后,以后,可认为:可认为:偏自相关函数是截尾的。再次

83、验证了一偏自相关函数是截尾的。再次验证了一阶差分后的阶差分后的GDPGDP满足满足AR(2)AR(2)随机过程。随机过程。设序列设序列GDPD1的模型形式为:的模型形式为: 有如下有如下Yule Walker Yule Walker 方程:方程: 解为:解为: 用用OLSOLS法回归的结果为:法回归的结果为: (7.91) (-3.60) r2=0.8469 R2=0.8385 DW=1.15 有时,在用回归法时,也可加入常数项。有时,在用回归法时,也可加入常数项。 本例中加入常数项的回归为:本例中加入常数项的回归为: (1.99) (7.74) (-3.58) r2 =0.8758 R2 =

84、0.8612 DW.=1.22 模型检验模型检验 下表列出三模型的残差项的自相关系数及下表列出三模型的残差项的自相关系数及QLB检验值。检验值。 模型模型1与模型与模型3的残差项接近于一白噪声,但的残差项接近于一白噪声,但模型模型2存在存在4阶滞后相关问题,阶滞后相关问题,Q统计量的检验也统计量的检验也得出模型得出模型2拒绝所有自相关系数为零的假设。因此拒绝所有自相关系数为零的假设。因此: : 模型模型1 1与与3 3可作为描述中国支出法可作为描述中国支出法GDPGDP一阶差分一阶差分序列的随机生成过程。序列的随机生成过程。用建立的用建立的AR(2)模型对中国支出法模型对中国支出法GDP进行外

85、推进行外推预测。预测。 模型模型1可作如下展开可作如下展开: 于是,当已知于是,当已知t-1、t-2、t-3期的期的GDP时,就时,就可对第可对第t期的期的GDP作出外推预测。作出外推预测。 对对2001年中国支出法年中国支出法GDP的预测结果(亿元)的预测结果(亿元) 预测值预测值 实际值实际值 误差误差 模型模型1 95469 95933 -0.48% 模型模型3 97160 95933 1.28% 模型模型3的预测式与此相类似,只不过多出一项常的预测式与此相类似,只不过多出一项常数项。数项。 由由于于中中国国人人均均居居民民消消费费(CPCCPC)与与人人均均国国内内生生产产总总值值(G

86、DPPCGDPPC)这这两两时时间间序序列列是是非非平平稳稳的的,因此不宜直接建立它们的因果关系回归方程。因此不宜直接建立它们的因果关系回归方程。 但但它它们们都都是是I(2)I(2)时时间间序序列列,因因此此可可以以建建立立它们的它们的ARIMA(p,d,qARIMA(p,d,q) )模型。模型。 例例9.2.4 中国人均居民消费的中国人均居民消费的ARMA(p,qARMA(p,q) )模型模型 下面只建立下面只建立中国人均居民消费(中国人均居民消费(CPC)的的随机时间序列模型。随机时间序列模型。 中国人均居民消费(中国人均居民消费(CPC)经过二次差)经过二次差分后的新序列记为分后的新序

87、列记为CPCD2,其自相关函数、,其自相关函数、偏自相关函数及偏自相关函数及Q统计量的值列于下表:统计量的值列于下表: 在在5%5%的显著性水平下,通过的显著性水平下,通过Q Q统计量容易验证统计量容易验证该序列本身就接近于一白噪声,因此可该序列本身就接近于一白噪声,因此可考虑采用考虑采用零阶零阶MA(0)MA(0)模型模型: : 由于由于k=2k=2时,时,|r|r2 2|=|-0.29|=|-0.29| 因此因此, ,也可考虑采用下面的也可考虑采用下面的MAMA模型模型: 当然,还可观察到自相关函数在滞后当然,还可观察到自相关函数在滞后4 4、5 5、8 8时有大于时有大于0.20.2的函

88、数值,因此,可考虑在模型的函数值,因此,可考虑在模型中增加中增加MA(4)MA(4)、MA(5)MA(5)、MA(8)MA(8)。不同模型的回归不同模型的回归结果列于表结果列于表9.2.59.2.5。 可以看出可以看出: :在纯在纯MAMA模型中,模型模型中,模型4 4具有较好的具有较好的性质,但由于性质,但由于MA(5)MA(5)的的t t检验偏小,因此可选取模检验偏小,因此可选取模型型3 3。 最后,给出通过模型最后,给出通过模型3 3的外推预测。的外推预测。 模型模型3 3的展开式为的展开式为: 即即 , 由于由于 t t表示预测期的随机扰动项,它未知,表示预测期的随机扰动项,它未知,可

89、假设为可假设为0 0,于是,于是t t期的预测式为期的预测式为: : 为模型为模型3 3中滞后中滞后2 2期与滞后期与滞后4 4期的相应残期的相应残差项的估计值。差项的估计值。 表表9.2.69.2.6列出了采用模型列出了采用模型3 3对中国居民人均居对中国居民人均居民消费水平的民消费水平的2 2期外推预测。期外推预测。 为了对照,表中也同时列出了采用为了对照,表中也同时列出了采用2.102.10的模的模型的预测结果型的预测结果。 9.3 9.3 协整与误差修正模型协整与误差修正模型一、一、长期均衡关系与协整长期均衡关系与协整二、二、协整检验协整检验三、三、误差修正模型误差修正模型一、长期均衡

90、关系与协整一、长期均衡关系与协整1. 问题的提出问题的提出经经典典回回归归模模型型(classical regression model)是是建建立立在在稳稳定定数数据据变变量量基基础础上上的的,对对于于非非稳稳定定变变量量,不不能能使使用用经经典典回回归归模模型型,否否则则会会出出现现虚虚假假回归回归等诸多问题。等诸多问题。由由于于许许多多经经济济变变量量是是非非稳稳定定的的,这这就就给给经经典典的的回归分析方法带来了很大限制。回归分析方法带来了很大限制。但但是是,如如果果变变量量之之间间有有着着长长期期的的稳稳定定关关系系,即即它它们们之之间间是是协协整整的的(cointegration)

91、,则则是是可可以以使用经典回归模型方法建立回归模型的。使用经典回归模型方法建立回归模型的。例例如如,中中国国居居民民人人均均消消费费水水平平与与人人均均GDPGDP变变量量的的例例子子中中, , 因因果果关关系系回回归归模模型型要要比比ARMAARMA模模型型有有更更好好的的预预测测功功能能,其其原原因因在在于于,从从经经济济理理论论上上说说,人人均均GDP决决定定着着居居民民人人均均消消费费水水平平,而而且且它它们们之之间间有有着着长长期期的的稳稳定定关关系系,即即它它们们之之间是协整的。间是协整的。 经经济济理理论论指指出出,某某些些经经济济变变量量间间确确实实存存在在着着长长期期均均衡衡

92、关关系系,这这种种均均衡衡关关系系意意味味着着经经济济系系统统不不存存在在破破坏坏均均衡衡的的内内在在机机制制,如如果果变变量量在在某某时时期期受受到到干干扰扰后后偏偏离离其其长长期期均均衡衡点点,则则均均衡衡机机制制将将会会在在下下一一期期进进行行调调整整以以使使其其重重新新回回到到均均衡衡状状态。态。 假设假设X与与Y间的长期间的长期“均衡关系均衡关系”由式描述由式描述: 2. 2. 长期均衡长期均衡式中式中: : t t是随机扰动项是随机扰动项。 该均衡关系意味着该均衡关系意味着: :给定给定X的一个值,的一个值,Y相应相应的均衡值也随之确定为的均衡值也随之确定为0 0+ + 1 1X。

93、 在在t-1期末,存在下述三种情形之一:期末,存在下述三种情形之一: (1)Y等于它的均衡值:Yt-1= 0+1Xt ; (2)Y小于它的均衡值:Yt-1 0+1Xt ; 在时期t,假设X有一个变化量Xt,如果变量X与Y在时期t与t-1末期仍满足它们间的长期均衡关系,则Y的相应变化量由式给出:式中,式中,v vt t= = t t- - t-1t-1。 实际情况往往并非如此实际情况往往并非如此 如如果果t-1期期末末,发发生生了了上上述述第第二二种种情情况况,即即Y的的值值小小于于其其均均衡衡值值,则则Y的的变变化化往往往往会会比比第一种情形下第一种情形下Y的变化的变化 Yt大一些;大一些;

94、反反之之,如如果果Y的的值值大大于于其其均均衡衡值值,则则Y的的变化往往会小于第一种情形下的变化往往会小于第一种情形下的 Yt 。 可见,如果可见,如果Yt= 0+ 1Xt+ t正确地提示正确地提示了了X与与Y间的长期稳定的间的长期稳定的“均衡关系均衡关系”,则意味着,则意味着Y对其均衡点的偏离从本质上说是对其均衡点的偏离从本质上说是“临时性临时性”的。的。 因此,因此,一个重要的假设就是一个重要的假设就是:随机扰动项随机扰动项 t必须是平稳序列。必须是平稳序列。 显然,如果显然,如果 t有随机性趋势(上升或下降),有随机性趋势(上升或下降),则会导致则会导致Y对其均衡点的任何偏离都会被长期累

95、对其均衡点的任何偏离都会被长期累积下来而不能被消除。积下来而不能被消除。 式式Yt= = 0 0+ + 1 1Xt+ + t t中的随机扰动项也被称中的随机扰动项也被称为为非均衡误差(非均衡误差(disequilibrium error),它是变,它是变量量X与与Y的一个线性组合:的一个线性组合: (*) 因此,如果因此,如果Yt= = 0 0+ + 1 1Xt+ + t t式所示的式所示的X与与Y间的长期均衡关系正确的话,(间的长期均衡关系正确的话,(*)式表述的)式表述的非均衡误差应是一平稳时间序列,并且具有零非均衡误差应是一平稳时间序列,并且具有零期望值,即是具有期望值,即是具有0均值的

96、均值的I(0)序列。序列。从这里已看到从这里已看到,非稳定的时间序列,它们的非稳定的时间序列,它们的线性组合也可能成为平稳的。线性组合也可能成为平稳的。 假设假设Yt= 0+ 1Xt+ t式中的式中的X与与Y是是I(1)序列,如果该式所表述的它们间的长期均序列,如果该式所表述的它们间的长期均衡关系成立的话,则意味着由非均衡误差衡关系成立的话,则意味着由非均衡误差(*)式给出的线性组合是)式给出的线性组合是I(0)序列。这时我序列。这时我们们称变量称变量X与与Y是协整的(是协整的(cointegrated)。)。 如果序列如果序列XX1t1t,X,X2t2t,X Xktkt 都是都是d阶单整,存

97、在阶单整,存在向量向量: : =(=( 1 1, , 2 2, k k) ),使得,使得: : Zt= XT I(d-b) 其中,其中,b0,X=(X=(X1t1t,X,X2t2t,X Xktkt) )T T,则认为序列,则认为序列XX1t1t,X,X2t2t,X Xktkt 是是(d,b)阶协整,记为阶协整,记为XtCI(d,b), 为为协整向量(协整向量(cointegrated vector)。3.3.协整协整 在中国居民人均消费与人均在中国居民人均消费与人均GDP的例中,的例中,该两序列都是该两序列都是2阶单整序列,而且可以证明它们阶单整序列,而且可以证明它们有一个线性组合构成的新序列

98、为有一个线性组合构成的新序列为0阶单整序列,阶单整序列,于是认为该两序列是于是认为该两序列是(2,2)阶协整。阶协整。 由此可见由此可见: :如果两个变量都是单整变量,只如果两个变量都是单整变量,只有当它们的单整阶数相同时,才可能协整;如果有当它们的单整阶数相同时,才可能协整;如果它们的单整阶数不相同,就不可能协整。它们的单整阶数不相同,就不可能协整。 三个以上的变量,如果具有不同的单整阶三个以上的变量,如果具有不同的单整阶数,有可能经过线性组合构成低阶单整变量。数,有可能经过线性组合构成低阶单整变量。 例如,如果存在:例如,如果存在:并且,并且,那么认为:那么认为: (d,d)阶阶协协整整是

99、是一一类类非非常常重重要要的的协协整整关关系系,它它的的经经济济意意义义在在于于:两两个个变变量量,虽虽然然它它们们具具有有各各自自的的长长期期波波动动规规律律,但但是是如如果果它它们们是是(d,dd,d)阶阶协协整整的的,则它们之间存在着一个长期稳定的比例关系。则它们之间存在着一个长期稳定的比例关系。 例例如如:前前面面提提到到的的中中国国CPC和和GDPPC,它它们们各各自自都都是是2阶阶单单整整,并并且且将将会会看看到到,它它们们是是(2,2)(2,2)阶阶协协整整,说说明明它它们们之之间间存存在在着着一一个个长长期期稳稳定定的的比比例例关关系系,从从计计量量经经济济学学模模型型的的意意

100、义义上上讲讲,建建立立如如下下居居民民人人均均消消费函数模型:费函数模型: 从协整的定义可以看出从协整的定义可以看出: 变量选择是合理的,随机误差项一定是变量选择是合理的,随机误差项一定是“白噪声白噪声”(即均值为(即均值为0,方差不变的稳定随机序,方差不变的稳定随机序列),模型参数有合理的经济解释。列),模型参数有合理的经济解释。 这也解释了尽管这两时间序列是非稳定的,这也解释了尽管这两时间序列是非稳定的,但却可以用经典的回归分析方法建立回归模型但却可以用经典的回归分析方法建立回归模型的原因。的原因。 从从这这里里,我我们们已已经经初初步步认认识识到到:检检验验变变量量之之间间的的协协整整关

101、关系系,在在建建立立计计量量经经济济学学模模型型中中是是非常重要的。非常重要的。 而而且且,从从变变量量之之间间是是否否具具有有协协整整关关系系出出发发选选择择模模型型的的变变量量,其其数数据据基基础础是是牢牢固固的的,其其统统计性质是优良的计性质是优良的。二、协整检验二、协整检验 1.1.两变量的两变量的Engle-GrangerEngle-Granger检验检验 为为了了检检验验两两变变量量Yt,Xt是是否否为为协协整整,Engle和和Granger于于1987年年提提出出两两步步检检验验法法,也也称称为为EG检验。检验。 第一步,第一步,用用OLS方法估计方程:方法估计方程: Yt= =

102、 0 0+ + 1 1Xt+ + t t并计算非均衡误差,得到:并计算非均衡误差,得到: 称为称为协整回归协整回归( (cointegrating)或或静态回归静态回归( (static regression) )。 的单整性的检验方法仍然是的单整性的检验方法仍然是DF检验或者检验或者ADF检验。检验。 由于协整回归中已含有截距项,则检验模型由于协整回归中已含有截距项,则检验模型中无需再用截距项。如使用模型中无需再用截距项。如使用模型1 进进行行检检验验时时,拒拒绝绝零零假假设设H0: =0,意意味味着着误误差差项项et是是平平稳稳序序列列,从从而而说说明明X与与Y间间是是协协整的整的。 需要

103、注意是需要注意是,这里的,这里的DF或或ADF检验是针对协检验是针对协整回归计算出的误差项,整回归计算出的误差项,而非真正的非均衡误而非真正的非均衡误差差 t进行的。进行的。 而而OLS法采用了残差最小平方和原理,因法采用了残差最小平方和原理,因此估计量此估计量 是向下偏倚的,这样将导致拒绝零假是向下偏倚的,这样将导致拒绝零假设的机会比实际情形大。设的机会比实际情形大。 于是对于是对e et t平稳性检验的平稳性检验的DFDF与与ADFADF临界值应该临界值应该比正常的比正常的DFDF与与ADFADF临界值还要小。临界值还要小。 MacKinnon(1991)通过模拟试验给出了协整检通过模拟试

104、验给出了协整检验的临界值,表验的临界值,表9.3.1是双变量情形下不同样本是双变量情形下不同样本容量的临界值。容量的临界值。 例例9.3.1 检验中国居民人均消费水平检验中国居民人均消费水平CPCCPC与人均与人均国内生产总值国内生产总值GDPPCGDPPC的协整关系。的协整关系。 在前文已知在前文已知CPC与与GDPPC都是都是I(2)序列,序列,而而2.10中已给出了它们的回归式:中已给出了它们的回归式: R2=0.9981 通过对该式计算的残差序列作通过对该式计算的残差序列作ADF检验,检验,得适当检验模型得适当检验模型 (-4.47) (3.93) (3.05) LM(1)=0.00

105、LM(2)=0.00 t=-4.47-3.75=ADF0.05,拒绝存在单位根的,拒绝存在单位根的假设,残差项是稳定的,因此假设,残差项是稳定的,因此中国居民人均消费中国居民人均消费水平与人均水平与人均GDPGDP是是(2,2)(2,2)阶协整的,说明了该两变阶协整的,说明了该两变量间存在长期稳定的量间存在长期稳定的“均衡均衡”关系。关系。 2.2.多变量协整关系的检验多变量协整关系的检验扩展的扩展的E-GE-G检验检验 多变量协整关系的检验要比双变量复杂一多变量协整关系的检验要比双变量复杂一些,主要在于些,主要在于协整变量间可能存在多种稳定的协整变量间可能存在多种稳定的线性组合线性组合。 假

106、设有假设有4个个I(1)变量变量Z、X、Y、W,它们有,它们有如下的长期均衡关系:如下的长期均衡关系:(*)其中,非均衡误差项其中,非均衡误差项 t t应是应是I(0)序列:序列: (*) 然而,如果然而,如果Z与与W,X与与Y间分别存在长期均衡间分别存在长期均衡关系:关系: 则则非非均均衡衡误误差差项项v1t、v2t一一定定是是稳稳定定序序列列I(0)。于于是是它它们们的的任任意意线线性性组组合合也也是是稳稳定定的的。例如:例如:(*)一定是一定是I(0)序列。序列。 由于由于v vt t象(象(*)式中的)式中的 t t一样,也是一样,也是Z、X、Y、W四个变量的线性组合,由此(四个变量的

107、线性组合,由此(*)式也)式也成为该四变量的另一稳定线性组合。成为该四变量的另一稳定线性组合。 (1, -1, - 0 0,-,- 1 1,-,- 2 2,-,- 3 3)是对应于()是对应于(*)式的协整向量,(式的协整向量,(1,-1,- 0 0- - 0 0,-,- 1 1,1,-,1,- 1 1)是对应)是对应于(于(*)式的协整向量。)式的协整向量。 对对于于多多变变量量的的协协整整检检验验过过程程,基基本本与与双双变变量量情情形形相相同同,即即需需检检验验变变量量是是否否具具有有同同阶阶单单整整性性,以及是否存在稳定的线性组合。以及是否存在稳定的线性组合。 在在检检验验是是否否存存

108、在在稳稳定定的的线线性性组组合合时时,需需通通过过设设置置一一个个变变量量为为被被解解释释变变量量,其其他他变变量量为为解解释释变变量,进行量,进行OLS估计并检验残差序列是否平稳。估计并检验残差序列是否平稳。 检验程序:检验程序:如果不平稳,如果不平稳,则需更换被解释变量,进行同样则需更换被解释变量,进行同样的的OLS估计及相应的残差项检验估计及相应的残差项检验。 当所有的变量都被作为被解释变量检验之当所有的变量都被作为被解释变量检验之后,仍不能得到平稳的残差项序列,则认为这后,仍不能得到平稳的残差项序列,则认为这些变量间不存在(些变量间不存在(d,d)阶协整。)阶协整。 同同样样地地,检检

109、验验残残差差项项是是否否平平稳稳的的DF与与ADF检检验验临临界界值值要要比比通通常常的的DF与与ADF检检验验临临界界值值小小,而且该临界值还受到所检验的变量个数的影响。而且该临界值还受到所检验的变量个数的影响。 表表9.3.2给出了给出了MacKinnon(1991)通过模拟试通过模拟试验得到的不同变量协整检验的临界值。验得到的不同变量协整检验的临界值。3 3、多变量协整关系的检验、多变量协整关系的检验JJJJ检验检验Johansen于于1988年,以及与年,以及与Juselius于于1990年提年提出了一种用极大或然法进行检验的方法,通常出了一种用极大或然法进行检验的方法,通常称为称为J

110、J检验。检验。 高等计量经济学高等计量经济学(清华大学出版社,(清华大学出版社,2000年年9月)月)P279-282.E-views中有中有JJ检验的功能。检验的功能。三、误差修正模型三、误差修正模型 前文已经提到,前文已经提到,对于非稳定时间序列,可通过对于非稳定时间序列,可通过差分的方法将其化为稳定序列,然后才可建立差分的方法将其化为稳定序列,然后才可建立经典的回归分析模型。经典的回归分析模型。 例例如如:建建立立人人均均消消费费水水平平(Y)与与人人均均可可支支配收入(配收入(X)之间的回归模型:)之间的回归模型: 1 1、误差修正模型、误差修正模型式中,式中, vt= t t- -

111、t-1t-1差分差分X,Y成为平稳序列建立差分回归模型建立差分回归模型 如果如果Y与与X具有共同的具有共同的向上或向下向上或向下的变化趋势的变化趋势然而,然而,这种做法会引起两个问题这种做法会引起两个问题:(1)如果如果X与与Y间存在着长期稳定的均衡关系:间存在着长期稳定的均衡关系: Yt= 0+ 1Xt+ t且误差项且误差项 t不存在序列相关,则差分式:不存在序列相关,则差分式: Yt= 1 Xt+ t 中的中的 t是一个一阶移动平均时间序列,因而是序是一个一阶移动平均时间序列,因而是序列相关的;列相关的; (2)如如果果采采用用差差分分形形式式进进行行估估计计,则则关关于于变变量量水水平平

112、值值的的重重要要信信息息将将被被忽忽略略,这这时时模模型型只只表表达达了了X与与Y间间的的短短期期关关系系,而而没没有有揭揭示示它它们们间间的的长长期关系期关系。 因因为为,从从长长期期均均衡衡的的观观点点看看,Y在在第第t期期的的变变化化不不仅仅取取决决于于X本本身身的的变变化化,还还取取决决于于X与与Y在在t-1期末的状态,尤其是期末的状态,尤其是X与与Y在在t-1期的不平衡程度。期的不平衡程度。 例如,使用例如,使用 Yt= 1 Xt+ t回归时,很少出回归时,很少出现截距项显著为零的情况,即我们常常会得到如现截距项显著为零的情况,即我们常常会得到如下形式的方程:下形式的方程: 在在X保

113、持不变时,如果模型存在静态均衡保持不变时,如果模型存在静态均衡(static equilibrium),),Y也会保持它的长期均衡也会保持它的长期均衡值不变。值不变。(*)但如果使用(但如果使用(*)式,即使)式,即使X保持不变,保持不变,Y也会处也会处于长期上升或下降的过程中于长期上升或下降的过程中(Why?),这意味着,这意味着X与与Y间不存在静态均衡间不存在静态均衡。 这与大多数具有静态均衡的经济理论假说这与大多数具有静态均衡的经济理论假说不相符。不相符。 可见,简单差分不一定能解决非平稳时间可见,简单差分不一定能解决非平稳时间序列所遇到的全部问题,因此,序列所遇到的全部问题,因此,误差

114、修正模型误差修正模型便应运而生。便应运而生。 误差修正模型(误差修正模型(Error Correction Model,简,简记为记为ECM)是一种具有特定形式的计量经济学模是一种具有特定形式的计量经济学模型型,它的主要形式是由,它的主要形式是由Davidson、 Hendry、Srba和和Yeo于于1978年提出的,年提出的,称为称为DHSY模型模型。 通过一个具体的模型来介绍它的结构。通过一个具体的模型来介绍它的结构。 假设两变量假设两变量X X与与Y Y的长期均衡关系为的长期均衡关系为: Yt= = 0 0+ + 1 1Xt+ + t t 该模型显示出第该模型显示出第t期的期的Y值,不仅

115、与值,不仅与X的变化的变化有关,而且与有关,而且与t-1期期X与与Y的状态值有关。的状态值有关。 由于现实经济中由于现实经济中X与与Y很少处在均衡点上,很少处在均衡点上,因此实际观测到的只是因此实际观测到的只是X与与Y间的短期的或非均间的短期的或非均衡的关系,假设具有如下衡的关系,假设具有如下(1,1)阶分布滞后形式:阶分布滞后形式: 由于变量可能是非平稳的,因此不能直接运由于变量可能是非平稳的,因此不能直接运用用OLS法。对上述法。对上述分布滞后模型适当变形分布滞后模型适当变形得:得: 或,或, 式中,式中, (*) 如果将(如果将(*)中的参数,与)中的参数,与Yt= = 0 0+ + 1

116、 1Xt+ + t t中的相应参数视为相等,则中的相应参数视为相等,则(*)式中括号内的项就是)式中括号内的项就是t-1期的非均衡误差项。期的非均衡误差项。 (*)式表明:)式表明:Y Y的变化决定于的变化决定于X X的变化以及的变化以及前一时期的非均衡程度前一时期的非均衡程度。同时,(。同时,(*)式也弥补)式也弥补了简单差分模型了简单差分模型 Yt= 1 Xt+ t的不足,因为该的不足,因为该式含有用式含有用X、Y水平值表示的前期非均衡程度。水平值表示的前期非均衡程度。因此,因此,Y Y的值已对前期的非均衡程度作出了修正。的值已对前期的非均衡程度作出了修正。 称为称为一阶误差修正模型一阶误

117、差修正模型( (first-order error correction model) )。 (*)式可以写成:)式可以写成: (*)(*)其中其中: :ecmecm表示表示误差修正项误差修正项。由。由分布滞后模型:分布滞后模型:知,一般情况下知,一般情况下| | | |1 ,由关系式,由关系式 =1-=1- 得:得:00 11。可以据此分析可以据此分析ecmecm的修正作用:的修正作用: (1)(1)若若(t-1)(t-1)时刻时刻Y Y大于其长期均衡解大于其长期均衡解 0 0+ + 1 1X X,ecmecm为正,则为正,则(-(- ecmecm) )为负,使得为负,使得 Y Yt t减少

118、;减少; (2)(2)若若(t-1)(t-1)时刻时刻Y Y小于其长期均衡解小于其长期均衡解 0 0+ + 1 1X X ,ecmecm为负,则为负,则(-(- ecmecm) )为正,使得为正,使得 Y Yt t增大。增大。 (*)体现了长期非均衡误差对的控制。)体现了长期非均衡误差对的控制。 其主要原因在于其主要原因在于变量对数的差分近似地等变量对数的差分近似地等于该变量的变化率,而经济变量的变化率常常于该变量的变化率,而经济变量的变化率常常是稳定序列,因此适合于包含在经典回归方程是稳定序列,因此适合于包含在经典回归方程中。中。 需要注意的是需要注意的是:在实际分析中,变量常以对在实际分析

119、中,变量常以对数的形式出现。数的形式出现。于是于是: : (1)(1)长期均衡模型长期均衡模型 Yt= = 0 0+ + 1 1Xt+ + t t中的中的 1 1可视为可视为Y关于关于X的的长期弹性(长期弹性(long-run elasticity) (2)(2)短期非均衡模型短期非均衡模型 Y Yt t= = 0 0+ + 1 1X Xt t+ + 2 2X Xt-1t-1+ + Y Yt-1t-1+ + t t中的中的 1 1可视为可视为Y关于关于X的的短期弹性(短期弹性(short-run elasticity)。 如如具有季度数据的变量,可在短期非均衡具有季度数据的变量,可在短期非均衡

120、模型:模型: Y Yt t= = 0 0+ + 1 1X Xt t+ + 2 2X Xt-1t-1+ + Y Yt-1t-1+ + t t中引入更多的滞后项。中引入更多的滞后项。 更复杂的误差修正模型更复杂的误差修正模型可依照一阶误差修正可依照一阶误差修正模型类似地建立。模型类似地建立。 引入二阶滞后的模型引入二阶滞后的模型为为: 经过适当的衡等变形,可得如下经过适当的衡等变形,可得如下二阶误差二阶误差修正模型:修正模型: (*) 引入引入三阶滞后项的误差修正模型三阶滞后项的误差修正模型与(与(*)式)式相仿,只不过模型中多出差分滞后项相仿,只不过模型中多出差分滞后项 Yt-2, Xt-2,。

121、,。 多变量的误差修正模型多变量的误差修正模型也可类似地建立。也可类似地建立。 如如三个变量三个变量如果存在如下长期均衡关系:如果存在如下长期均衡关系:则则其一阶非均衡关系其一阶非均衡关系可写成:可写成: 于是它的于是它的一个误差修正模型一个误差修正模型为:为: (1)Granger 表述定理表述定理 误差修正模型有许多明显的误差修正模型有许多明显的优点优点:如:如: a)一一阶阶差差分分项项的的使使用用消消除除了了变变量量可可能能存存在在的趋势因素,从而避免了虚假回归问题;的趋势因素,从而避免了虚假回归问题; b)一一阶阶差差分分项项的的使使用用也也消消除除模模型型可可能能存存在在的多重共线

122、性问题;的多重共线性问题;2 2、误差修正模型的建立、误差修正模型的建立 c)误差修正项的引入保证了变量水平值的)误差修正项的引入保证了变量水平值的信息没有被忽视;信息没有被忽视; d)由于误差修正项本身的平稳性,使得该)由于误差修正项本身的平稳性,使得该模型可以用经典的回归方法进行估计,尤其是模型可以用经典的回归方法进行估计,尤其是模型中差分项可以使用通常的模型中差分项可以使用通常的t检验与检验与F检验来检验来进行选取;等等。进行选取;等等。 因此,因此,一个重要的问题就是一个重要的问题就是:是否变量间的是否变量间的关系都可以通过误差修正模型来表述?关系都可以通过误差修正模型来表述? 如果变

123、量如果变量X X与与Y Y是协整的,则它们间的短期是协整的,则它们间的短期非均衡关系总能由一个误差修正模型表述:非均衡关系总能由一个误差修正模型表述:01 (*)式中,t-1是非均衡误差项是非均衡误差项或者说成是长期均长期均衡偏差项衡偏差项, 是短期调整参数短期调整参数。 Engle 与与 Granger 1987年提出了著名的年提出了著名的Grange表述定理(表述定理(Granger representaion theorem):): 对于对于(1,1)阶自回归分布滞后模型:阶自回归分布滞后模型: Yt= 0+ 1Xt+ 2Xt-1+ Yt-1+ t 如果如果 YtI(1), XtI(1)

124、 ; 那么,那么,的左边的左边 Yt I(0) ,右边的右边的 Xt I(0) ,因此,因此,只有只有Y与与X协整,才能保证右边也是协整,才能保证右边也是I(0)。 首首先先对对变变量量进进行行协协整整分分析析,以以发发现现变变量量之之间间的的协协整整关关系系,即即长长期期均均衡衡关关系系,并并以以这这种种关关系构成误差修正项。系构成误差修正项。 然然后后建建立立短短期期模模型型,将将误误差差修修正正项项看看作作一一个个解解释释变变量量,连连同同其其他他反反映映短短期期波波动动的的解解释释变变量一起,建立短期模型,即误差修正模型。量一起,建立短期模型,即误差修正模型。 因此,因此,建立误差修正

125、模型建立误差修正模型,需要:,需要: 注意注意,由于,由于, Y=lagged( Y, X)+ t-1 t-1 + t 0 11中中没没有有明明确确指指出出Y与与X的的滞滞后后项项数数,因因此此,可可以以是是多多个个;同同时时,由由于于一一阶阶差差分分项项是是I(0)变变量量,因因此模型中也允许使用此模型中也允许使用X的非滞后差分项的非滞后差分项 Xt 。 GrangerGranger表表述述定定理理可可类类似似地地推推广广到到多多个个变变量量的情形中去。的情形中去。 由由协协整整与与误误差差修修正正模模型型的的的的关关系系,可可以以得得到到误差修正模型建立的误差修正模型建立的E-G两步法:两

126、步法: 第第一一步步,进进行行协协整整回回归归(OLS法法),检检验验变变量量间间的的协协整整关关系系,估估计计协协整整向向量量(长长期期均均衡衡关关系系参数);参数); 第第二二步步,若若协协整整性性存存在在,则则以以第第一一步步求求到到的的残残差差作作为为非非均均衡衡误误差差项项加加入入到到误误差差修修正正模模型型中中,并用并用OLS法估计相应参数。法估计相应参数。 (2)Engle-Granger两步法两步法 需要注意的是需要注意的是:在进行变量间的协整检验在进行变量间的协整检验时,如有必要可在协整回归式中加入趋势项,时,如有必要可在协整回归式中加入趋势项,这时,对残差项的稳定性检验就无

127、须再设趋势这时,对残差项的稳定性检验就无须再设趋势项。项。 另外,第二步中变量差分滞后项的多少,另外,第二步中变量差分滞后项的多少,可以残差项序列是否存在自相关性来判断,如可以残差项序列是否存在自相关性来判断,如果存在自相关,则应加入变量差分的滞后项。果存在自相关,则应加入变量差分的滞后项。(3)直接估计法)直接估计法 也可以也可以采用打开误差修整模型中非均衡误采用打开误差修整模型中非均衡误差项括号的方法直接用差项括号的方法直接用OLS法估计模型法估计模型。 但仍需事先对变量间的协整关系进行检验但仍需事先对变量间的协整关系进行检验。如对双变量误差修正模型如对双变量误差修正模型: :可打开非均衡

128、误差项的括号直接估计下式:可打开非均衡误差项的括号直接估计下式:这时短期弹性与长期弹性可一并获得。这时短期弹性与长期弹性可一并获得。 需注意的是,需注意的是,用不同方法建立的误差修正用不同方法建立的误差修正模型结果也往往不一样。模型结果也往往不一样。 经经济济理理论论指指出出,居居民民消消费费支支出出是是其其实实际际收收入的函数。入的函数。 以以中中国国国国民民核核算算中中的的居居民民消消费费支支出出经经过过居居民民消消费费价价格格指指数数缩缩减减得得到到中中国国居居民民实实际际消消费费支支出时间序列(出时间序列(C);); 以以支支出出法法GDP对对居居民民消消费费价价格格指指数数缩缩减减近

129、近似地代表国民收入时间序列似地代表国民收入时间序列(GDP)。 时间段为时间段为19782000(表(表9.3.3) 例例9.3.2 中国居民消费的误差修正模型中国居民消费的误差修正模型 (1 1)对数据)对数据lnC与与lnGDP进行单整检验进行单整检验 容易验证容易验证lnC与与lnGDP是一阶单整的,它们是一阶单整的,它们适合的检验模型如下:适合的检验模型如下: (3.81)(-4.01) (2.66) (2.26) (2.54) LM(1)=0.38 LM(2)=0.67 LM(3)=2.34 LM(4)=2.46 首先,建立首先,建立lnC与与lnGDP的回归模型的回归模型: :(2

130、)检验)检验lnC与与lnGDP的协整性,并建立长期均衡关系的协整性,并建立长期均衡关系 (0.30) (57.48) R2=0.994 DW=0.744 发现有残关项有较强的一阶自相关性。考发现有残关项有较强的一阶自相关性。考虑加入适当的滞后项,得虑加入适当的滞后项,得lnC与与lnGDP的分布的分布滞后模型滞后模型: : (1.63) (6.62) (4.92) (-2.17) R2=0.994 DW=1.92 LM(1)=0.00 LM(2)=2.31 自相关性消除,因此可初步认为是自相关性消除,因此可初步认为是lnC与与lnGDP的长期稳定关系。的长期稳定关系。 (*) 残差项的稳定性

131、检验:残差项的稳定性检验: (-4.32) R2=0.994 DW=2.01 LM(1)=0.04 LM(2)=1.34 t=-4.32-3.64=ADF0.05 说明说明lnC与与lnGDP是(是(1,1)阶协整的,)阶协整的,(*)式即为它们长期稳定的均衡关系)式即为它们长期稳定的均衡关系: : (*)以稳定的时间序列以稳定的时间序列 如下如下:(3)建立误差修正模型)建立误差修正模型 做为误差修正项,可建立做为误差修正项,可建立误差修正模型误差修正模型: : (6.96) (2.96) (-1.91) (-3.15) R2=0.994 DW=2.06 LM(1)=0.70 LM(2)=2

132、.04(*) 可得可得lnC关于关于lnGDP的长期弹性:的长期弹性: (0.698-0.361)/(1-0.622)=0.892; 由(由(*)式可得)式可得lnC关于关于lnGDP的短期弹性:的短期弹性:0.686由由(*)式式: 用打开误差修正项括号的方法直接估计误差用打开误差修正项括号的方法直接估计误差修正模型,适当估计式为修正模型,适当估计式为: (1.63) (6.62) (-2.99) (2.88) R2=0.791 =0.0064 DW=1.93 LM(2)=2.31 LM(3)=2.78 写成误差修正模型的形式如下写成误差修正模型的形式如下: : (*) 由(由(*)式知,)

133、式知,lnC关于关于lnGDP的短期弹的短期弹性为性为0.698,长期弹性为,长期弹性为0.892。 可见可见两种方法的结果非常接近两种方法的结果非常接近。 (4)预测)预测由由(*)式式: :给出给出1998年关于长期均衡点的偏差:年关于长期均衡点的偏差:=ln(18230)-0.152-0.698ln(39008)-0.662ln(17072) +0.361ln(36684)= 0.0125 由(由(*)式)式: :预测预测1999年的短期波动:年的短期波动: lnC99=0.686(ln(41400)-ln(39008)+0.784(ln(18230)-ln(17072)-0.484(ln(39008)-ln(36684)-1.1630.0125= 0.048于是于是: : 按照(按照(* )式)式: :预测的结果为预测的结果为: : lnC99=0.698(ln(41400)-ln(39008)-0.378(ln(18230)-0.405-0.892ln(39008)=0.051 以当年价计的以当年价计的1999年实际居民消费支出为年实际居民消费支出为39334亿元,用居民消费价格指数(亿元,用居民消费价格指数(1990=100)紧缩后约为紧缩后约为19697亿元,亿元,两个预测结果的相对误两个预测结果的相对误差分别为差分别为2.9%与与2.6%。 于是于是:

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号