文档详情

第12章自相关

汽***
实名认证
店铺
PPT
524.50KB
约76页
文档ID:608576928
第12章自相关_第1页
1/76

单击此处编辑母版标题样式,,单击此处编辑母版文本样式,,单击此处编辑母版文本样式,,,,,*,Econometrics,,单击此处编辑母版标题样式,,单击此处编辑母版文本样式,,第二级,,第三级,,第四级,,第五级,,*,,*,单击此处编辑母版标题样式,,单击此处编辑母版文本样式,,第二级,,第三级,,第四级,,第五级,,*,,*,第12章自相关,,检验结果表明:,回归系数的标准误差非常小,t 统计量较大,说明居民收入 对居民储蓄存款 的影响非常显著同时可决系数也非常高,F统计量为,也表明模型异常的显著但此估计结果可能是虚假的,t统计量和F统计量都被虚假地夸大,因此所得结果是不可信的为什么?,,,,2,,本章讨论四个问题:,,,●什么是自相关,,●自相关的后果,,●自相关的检验,,●自相关性的补救,第12章 自相关,,3,第一节 什么是自相关,本节基本内容:,,,●什么是自相关,,●自相关产生的原因,,●自相关的表现形式,,,4,第一节 什么是自相关,一、自相关的概念,,自相关,(auto correlation),又称,序列相关,(serial correlation)是指总体回归模型的随机误差项之间存在相关关系。

即不同观测点上的误差项彼此相关5,自相关的性质,,自相关的含义:按时间(时间序列数据)或空间(横截面数据)排列的观测值序列的成员之间的相关经典线性回归模型假定在干扰项之间不存在自相关:,本教材将自相关和序列相关看成同义语,,,,6,上式中 是 滞后一期的随机误差项因此,将上式计算的自相关系数,,称为一阶自相关系数一阶自相关系数,,自相关系数 的定义与普通相关系的公式形式相同,的取值范围为,,7,二、自相关产生的原因,自,,相,,关,,产,,生,,的,,原,,因,经济系统的惯性,经济活动的滞后效应,,数据处理造成的相关,蛛网现象,,模型设定偏误,,,8,自相关的来源详解,惯性:,GNP,、,价格指数、生产、就业和失业等时间序列变量都呈现出商业循环设定偏误:应含而未含变量(,excluded variables,),比如:,在猪肉价格影响牛肉消费的情形下,残差v将表现出某种系统的模式,,9,设定偏误:不正确的函数形式,,假如在成本,—,产出研究中,“真实”模型为:,由于函数形式的错误使用,残差将反映出自相关性质,蛛网现象(,Cobweb phenomenon,),,,供给对价格的反应要滞后一个时期,,10,滞后效应,,在消费支出对收入的时间序列回归中,当期消费还会受到前期消费水平的影响:,这种带有因变量的滞后值的回归也叫自回归(,auto-regression,),,数据的“编造”,,从月度数据计算得出季度数据,会减小波动,引进匀滑作用,使扰动项出现系统性模式,,数据的内插(,interpolation,),,数据的外推(,extrapolation,),,,,11,三、自相关的表现形式,自相关的性质可以用自相关系数的符号判断,,即 为负相关,,,为正相 关。

当 接近1时,表示相关的程度很高自相关是 序列自身的相关,因随机误差项的关联形式不同而具有不同的自相关形式自相关多出现在时间序列数据中12,对于样本观测期为 的时间序列数据,可得到总体回归模型(,PRF,)的随机项为 ,如果自相关形式为,,,其中,,为自相关系数, 为经典误差项,即,,,则此式称为一阶自回归模式,记为 因为模型中 是 滞后一期的值,因此称为一阶此式中的 也称为一阶自相关系数自相关的形式,,13,如果式中的随机误差项 不是经典误差项,即其中包含有,,的成份,如包含有 则需将 显含在回归模型中,其为,,,,其中, 为一阶自相关系数, 为二阶自相关系数, 是经典误差项此式称为二阶自回归模式,记为 14,一般地,如果 之间的关系为,,,其中,,,为经典误差项则称此式为 阶自回归模式,记为 在经济计量分析中,通常采用一阶自回归形式,即假定自回归形式为一阶自回归 15,第二节 自相关的后果,本节基本内容:,,●一阶自回归形式的性质,,●自相关对参数估计的影响,,●自相关对模型检验的影响,,●自相关对模型预测的影响,,16,对于一元线性回归模型:,,,假定随机误差项 存在一阶自相关:,,,其中,,,为现期随机误差,,,为前期随机误差。

是经典误差项,满足零均值 ,同方差,,,无自相关 的假定一、一阶自回归形式的性质,,17,将随机误差项,,的各期滞后值:,,,逐次代入可得:,,,这表明随机误差项,,可表示为独立同分布的随机误差序列,,的加权和,权数分别为,,当 时,这些权数是随时间推移而呈几何衰减的;,,而当 时,这些权数是随时间推移而交错振荡衰减的18,可以推得:,,,,,,表明,在,,为一阶自回归的相关形式时,随机误差,,依然是零均值、同方差的误差项19,由于现期的随机误差项,,并不影响回归模型中随机误差项,,的以前各期值,,,所,,以 与,,不相关,即有 因此,可得随机误差项,,与其以前各期,,的协方差分别为:,,20,以此类推,可得,,:,,,,,这些协方差分别称为随机误差项 的一阶自协方差、二阶自协方差和,,,,阶自协方差,,21,二、对参数估计的影响,,在有自相关的条件下,仍然使用普通最小二乘法将低估估计量 的方差,,,,并且 将低估真实的,,,22,,对于一元线性回归模型,当,,为经典误差项时,普通最小二乘估计量 的方差为:,,随机误差项 有自相关时, 依然是无偏的,即 ,这一点在普通最小二乘法无偏性证明中可以看到。

因为,无偏性证明并不需要 满足无自相关的假定那么,最小二乘估计量 是否是有效呢?下面我们将说明23,例如,一元回归中,,,,,24,当存在自相关时,普通最小二乘估计量不再是最佳线性无估计量,即它性无偏估计量中不是方差最小的在实际经济系统中,通常存在正的自相关,即 ,同时 序列自身也呈正相关,因此式(12.18)右边括号内的值通常大于0因此,在有自相关的条件下,仍然使用普通最小二乘法将低估估计量 的方差 将低估真实的,,25,三、对模型检验的影响,对模型检验的影响,考虑自相关时的检验,忽视自相关时的检验,,26,由于 并不是所有线性无偏估计量中最小的,使用t检验判断回归系数的显著性时就可能得到错误的结论t检验统计量为:,,由于 的错误夸大,得到的,,统计量就可能小于临界值 ,从而得到参数,,,不显著的结论而这一结论可能是不正确的考虑自相关时的检验,,27,,,如果我们忽视自相关问题依然假设经典假定成立,使用 ,将会导致错误结果,当 ,即有正相关时,对所有 的有 另外回归模型中的解释变量在不同时期通常是正相关的,对于 和 来说,,是大于0的。

忽视自相关时的检验,,28,,因此,普通最小二乘法的方差 通常会低估 的真实方差当 较大和 有较强的正自相关时,普通最小二乘估计量的方差会有很大偏差,这会夸大估计量的估计精度,即得到较小的标准误因此在有自相关时,普通最小二乘估计 的标准误就不可靠了29,,一个被低估了的标准误意味着一个较大的t统计量因此,当 时,通常t统计量都很大这种有偏的t统计量不能用来判断回归系数的显著性综上所述,在自相关情形下,无论考虑自相关,还是忽视自相关,通常的回归系统显著性的t检验都将是无效的类似地,由于自相关的存在,参数的最小二乘估计量是无效的,使得F检验和t检验不再可靠30,四、对模型预测的影响,模型预测的精度决定于抽样误差和总体误差项的方差,,抽样误差来自于对 的估计,在自相关情形下,,,的方差的最小二乘估计变得不可靠,由此必定加大抽样误差同时,在自相关情形下,对,,的估计 也会不可靠由此可看出,影响预测精度的两大因素都会因自相关的存在而加大不确定性,使预测的置信区间不可靠,从而降低预测的精度31,第三节 自相关的检验,本节基本内容:,,● 图示检验法,,● DW检验法,,,32,一、图示检验法,图示法是一种直观的诊断方法,它是把给定的回归模直接用普通最小二乘法估计参数,求出残差项 , 作为 随机项的真实估计值,再描绘 的散点图,根据散点图来判断 的相关性。

残差 的散点图通常有两种绘制方式 33,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,图 12.1 与 的关系,绘制 的散点图用 作为散布点绘图,如果大部分点落在第Ⅰ、Ⅲ象限,表明随机误差项 存在着正自相关34,如果大部分点落在第Ⅱ、Ⅳ象限,那么随机误差项,,存在着负自相关e,t-,1,e,t,图 12.2,e,t,与,e,t,-1,的关系,,35,,,二、对模型检验的影响,,按照时间顺序绘制回归残差项 的图形如果,,,,,随着,,的变化逐次有规律地变化,,,呈现锯齿形或循环形状的变化,就可断言,,存在相关,表明存在着自相关;如果 随着,,的变化逐次变化并不断地改变符号,那么随机误差项 存在负自相关,,36,图 12.4 的分布,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,如果 随着 的变化逐次变化并不频繁地改变符号,而是几个正的 后面跟着几个负的,则表明随机误差项 存 在正自相关。

37,二、DW检验法,DW 检验是(杜宾)和(沃特森)于1951年提出的一种适用于小样本的检验方法DW检验只能用于检验随机误差项具有一阶自回归形式的自相关问题这种检验方法是建立经济计量模型中最常用的方法,一般的计算机软件都可以计算出DW 值38,随机误差项的一阶自回归形式为:,,,为了检验序列的相关性,构造的原假设是:,,,为了检验上述假设,构造DW统计量首先要求出回归估计式的残差 定义DW统计量为 :,,,,39,,40,由,,可得,DW,值与 的对应关系如表所示4,,(2,4),,2,,(0,2),,0,-1,,(-1,0),,0,,(0,1),,1,DW,,,41,由上述讨论可知DW的取值范围为:,,0≤DW≤4,,根据样本容量,,和解释变量的数目,,(不包括常数项)查DW分布表,得临界值 和 ,然后依下列准则考察计算得到的DW值,以决定模型的自相关状态42,DW,检验决策规则,误差项 间存在,负相关,,不能判定是否有自相关,,误差项 间,,无自相关,,不能判定是否有自相关,,误差项 间存在,,正相关,,,43,用坐标图更直观表示DW检验规则,:,不能确定,正自相关,无自相关,不能确定,负自相关,,4,,,2,,,,44,●,,DW检验有两个不能确定的区域,一旦DW值落在这两个区域,就无法判断。

这时,只有增大样本容量或选取其他方法,,●,,DW统计量的上、下界表要求 ,这是因为样本如果再小,利用残差就很难对自相关的存在性做出比较正确的诊断,,●,,DW检验不适应随机误差项具有高阶序列相关的检验,,●,只适用于有常数项的回归模型并且解释变量中不能含滞后的被解释变量,,DW检验的缺点和局限性,,45,第四节 自相关的补救,本节基本内容:,,,●广义差分法,,●科克伦-奥克特迭代法,,●其他方法简介,,46,一、广义差分法,对于自相关的结构已知的情形可采用广义差分法解决由于随机误差项 是不可观测的,通常我们假定 为一阶自回归形式,即 (12.25) 其中,, ,,,为经典误差项,当自相关系数为已知时,使用广义差分法,自相关问题就可彻底解决我们以一元线性回归模型为例说明广义差分法的应用47,对于一元线性回归模型,,,将模型(12.26)滞后一期可得,,,,,用,,乘式(12.27)两边,得,,,48,两式相减,可得,式中, 是经典误差项因此,模,,型已经是经典线性回归令:,则上式可以表示为:,,49,对模型()使用普通最小二乘估计就会得到参数估计的最佳线性无偏估计量。

这称为,广义差分方程,,因为被解释变量与解释变量均为现期值减去前期值的一部分,由此而得名50,二、,Cochrane - Orcutt,迭代法,在实际应用中,自相关系数,,往往是未知的, 必须通过一定的方法估计最简单的方法是据DW统计量估计 由DW 与 的关系可知 :,,,,但是,式(12.31)得到的是一个粗略的结果, 是对,,精度不高的估计其根本原因在于我们对有自相关的回归模型使用了普通最小二乘法为了得,到 的精确的估计值 ,人们通常采用科克伦-奥克特,(Cochrane-Orcutt)迭代法51,该方法利用残差 去估计未知的 对于一元线性回归模型,,,,假定 为一阶自回归形式,即 :,,,52,科克伦-奥克特,迭代法估计 的步骤如下:,,1.使用普遍最小二乘法估计模型,,,并获得残差:,,2.利用残差 做如下的回归,,53,3. 利用 ,对模型进行广义差分,即,,,,,,令,,,,使用普通最小二乘法,可得样本回归函数为:,,,54,4. 因为 并不是对,,的最佳估计,进一步迭代,寻求最佳估计由前一步估计的结果有:,,,将 代入原回归方程,求得新的残差如下:,,和,,55,我们并不能确认 是否是,,的最佳估计值,还要继续估计,,的第三轮估计值 。

当估计的 与 相差很小时,就找到了,,的最佳估计值5. 利用残差 做如下的回归,,,,这里得到的 就是,,的第二轮估计值,,,56,三、其它方法简介,(一)一阶差分法,,,式中, 为一阶自回归AR(1)将模型变换为 :,,,如果原模型存在完全一阶正自相关,即 则,,,其中, 为经典误差项则随机误差项为经典误差项,无自相关问题使用普通最小二乘法估计参数,可得到最佳线性无偏估计量57,(二)德宾两步法,,当自相关系数未知时,也可采用德宾提出的两步法,消除自相关将广义差分方程表示为:,,58,第一步,,把上式作为一个多元回归模型,使用普通最小二乘法估计参数把 的回归系数,,看作,,的一个估计值 第二步,,求得 后,使用 进行广义差分,,,求得序列: 和,,然后使用普通最小二乘法对广义差分方程估计,,参数,求得最佳线性无偏估计量59,,研究范围:,中国农村居民收入-消费模型,,(1985~2003),,研究目的:,消费模型是研究居民消费行为的工具和手段通过消费模型的分析可判断居民消费边际消费倾向,而边际消费倾向是宏观经济系统中的重要参数。

建立模型,,-居民消费, -居民收入,-随机误差项数据收集:,1985~2003年农村居民人均收入和消费 (见表12.3),第五节 案例分析,,60,表12.3 1985-2003年农村居民人均收入和消费,(单位:元),年份,全年人均纯收入 (现价),,全年人均消费性支出 (现价),消费价格指数,,(1985=100),人均实际纯,,收入,,(1985可比价),人均实际消费,,性支出,,(1985可比价),1985,397.60,317.42,100.0,397.60,317.40,1986,423.80,357.00,106.1,399.43,336.48,1987,462.60,398.30,112.7,410.47,353.42,1988,544.90,476.70,132.4,411.56,360.05,1989,601.50,535.40,157.9,380.94,339.08,1990,686.30,584.63,165.1,415.69,354.11,1991,708.60,619.80,168.9,419.54,366.96,1992,784.00,659.80,176.8,443.44,373.19,1993,921.60,769.70,201.0,458.51,382.94,,61,,年份,全年人均纯收入,,(现价),全年人均消费性支出,,(现价),消费价格,,指数,,(1985=100),人均实际纯收入,,(1985可比价),人均实际消费性支出,,(1985可比价),1994,1221.00,1016.81,248.0,492.34,410.00,1995,1577.70,1310.36,291.4,541.42,449.69,1996,1923.10,1572.10,314.4,611.67,500.03,1997,2090.10,1617.15,322.3,648.50,501.77,1998,2162.00,1590.33,319.1,677.53,498.28,1999,2214.30,1577.42,314.3,704.52,501.75,2000,2253.40,1670.00,314.0,717.64,531.85,2001,2366.40,1741.00,316.5,747.68,550.08,2002,2475.60,1834.00,315.2,785.41,581.85,2003,2622.24,1943.30,320.2,818.86,606.81,续 表,,62,据表12.3的数据使用普通最小二乘法估计消费模型得:,,,,该回归方程可决系数较高,回归系数均显著。

对样本量为19、一个解释变量的模型、5%显著水平,查DW统计表可知, ,模型中 ,显然消费模型中有自相关这也可从残差图中看出,点击EViews方程输出窗口的按钮Resids可得到残差图,如图12.6所示模型的建立、估计与检验,,63,图12.6 残差图,,64,自相关问题的处理,使用科克伦-奥克特的两步法解决自相关问题:,由模型可得残差序列 ,在EViews中,每次回归的残差存放在resid序列中,为了对残差进行回归分析,需生成命名为 的残差序列在主菜单选择Quick/Generate Series 或点击工作文件窗口工具栏中的Procs/Generate Series,在弹出的对话框中输入 ,点击OK得到残差序列 使用 进行滞后一期的自回归,在EViews 命今栏中输入ls e e(-1)可得回归方程:,,,65,可知 ,对原模型进行广义差分,得到广义差分方程:,,,对广义差分方程进行回归,在,EViews,命令栏中输入,,,回车后可得方程输出结果如表12.4。

66,,表12.4 广义差分方程输出结果,,,,,Dependent Variable:,Y-0.496014*Y(-1),,,,,Method: Least Squares,,,,,Date: 03/26/05 Time: 12:32,,,,,Sample(adjusted): 1986 2003,,,,,Included observations: 18 after adjusting endpoints,,,,,Variable,Coefficient,Std. Error,t-Statistic,Prob.,C,60.44431,8.964957,6.742287,0.0000,X-0.496014*X(-1),0.583287,0.029410,19.83325,0.0000,R-squared,0.960914,Mean dependent var,,231.9218,Adjusted R-squared,0.958472,S.D. dependent var,,49.34525,S.E. of regression,10.05584,Akaike info criterion,,7.558623,Sum squared resid,1617.919,Schwarz criterion,,7.657554,Log likelihood,-66.02761,F-statistic,,393.3577,Durbin-Watson stat,1.397928,Prob(F-statistic),,0.000000,,67,由表12.4可得回归方程为: 由于使用了广义差分数据,样本容量减少了1个,为18个。

查5%显著水平的,DW,统计表可知 模型中 ,说明广义差分模型中已无自相关同时,可决系数 统计量均达到理想水平68,对比模型,很明显普通最小二乘法低估了回归系数的标准误原模型中,,,广义差分模型中为,得到普莱斯-温斯腾变换的广义差分模型为:,,,69,可发现两者的参数估计值和各检验统计量的差别很,,微小,说明在本例中使用,普莱斯-温斯腾,变换与直,,接使用,科克伦-奥克特两步法,的估计结果无显著差,,异,这是因为本例中的样本还不算太小如果实际,,应用中样本较小,则两者的差异就会较大通常对于小样本,应采用,普莱斯-温斯腾,变换补充,,第一个观测值70,由差分方程可知:,,,由此,我们得到最终的中国农村居民消费模型:,,,,由模型(12.49)的中国农村居民消费模型可知,中国农村居民的边际消费倾向为0.5833,即中国农民每增加收入1元,将平均增加消费支出0.5833元最终模型结果,,71,本章小结,1.当总体回归模型的随机误差项在不同观测点上彼此相关时就产生了自相关问题2.自相关的出现有多种原因时间序列的惯性、模型设定错误、数据的处理等等。

3.在出现自相关时,普通最小二乘估计量依然是无偏、一致的,但不再是,有效的通常的t 检验和F 检验都不能有效地使用72,,4.为了研究问题的方便和考虑实际问题的代表意义,我们通常将自相关设定为一阶自相关即AR(1)模式用一阶自相关系数 表示自相关的程度与方向当然,实际问题也存在AR(m)模式或其它模式5.,由于 是不可观测的,通常我们使用 的估计量 判断 的特性我们可通过 的图形判断自相关的存在,也可使用依据 计算的DW,,统计量判断自相关的存在73,6.如果自相关系数 是已知的,我们可以使用广义差分法消除序列相关7.如果自相关系数是,,未知的,我们可采用科克伦-奥克特迭代法求得 的估计值,然后用广义差分法消除序列相关74,THANKS,第六章 结 束,,75,谢谢大家!,。

下载提示
相似文档
正为您匹配相似的精品文档