第五讲-多重共线性、异方差、自相关ppt课件

上传人:鲁** 文档编号:591554735 上传时间:2024-09-18 格式:PPT 页数:70 大小:761KB
返回 下载 相关 举报
第五讲-多重共线性、异方差、自相关ppt课件_第1页
第1页 / 共70页
第五讲-多重共线性、异方差、自相关ppt课件_第2页
第2页 / 共70页
第五讲-多重共线性、异方差、自相关ppt课件_第3页
第3页 / 共70页
第五讲-多重共线性、异方差、自相关ppt课件_第4页
第4页 / 共70页
第五讲-多重共线性、异方差、自相关ppt课件_第5页
第5页 / 共70页
点击查看更多>>
资源描述

《第五讲-多重共线性、异方差、自相关ppt课件》由会员分享,可在线阅读,更多相关《第五讲-多重共线性、异方差、自相关ppt课件(70页珍藏版)》请在金锄头文库上搜索。

1、v一、多重共线性的概念一、多重共线性的概念v二、多重共线性的后果二、多重共线性的后果v三、多重共线性的诊断三、多重共线性的诊断v四、克服多重共线性的方法四、克服多重共线性的方法v五、案例五、案例 6.1 多重共线性多重共线性第六章第六章 多重共线性、异方差及自相关多重共线性、异方差及自相关一、多重共线性的概念一、多重共线性的概念 如果某两个或多个解释变量之间出现了相关性,如果某两个或多个解释变量之间出现了相关性,则称为则称为多重共线性多重共线性(Multicollinearity)。含义:解释变量含义:解释变量的的样本向量样本向量近似线性相关。近似线性相关。多重共线性来源:多重共线性来源:(1

2、)解释变量)解释变量x受到同一个因素的影响;受到同一个因素的影响; 例如:政治事件对很多变量都产生影响,这些变量同时上升例如:政治事件对很多变量都产生影响,这些变量同时上升 或同时下降。或同时下降。(2)解释变量)解释变量x自己的当期和滞后期;自己的当期和滞后期;(3)错误设定。)错误设定。对于模型对于模型其基本假设之一是解释变量是互相独立的。其基本假设之一是解释变量是互相独立的。 二、多重共线性的后果二、多重共线性的后果的的OLS估计量为:估计量为:完全共线性指的是解释变量中完全共线性指的是解释变量中某个变量是其他变量的线性组某个变量是其他变量的线性组合,即合,即c1X1+c2X2+ckXk

3、=0其中其中ci不全为不全为0,i=1,k1、完全共线性下参数估计量不存在、完全共线性下参数估计量不存在如果存在如果存在完全共线性完全共线性,则,则 不存在,无法得不存在,无法得到参数的估计量。到参数的估计量。例:例:对离差形式的二元回归模型对离差形式的二元回归模型如果两个解释变量完全相关,如如果两个解释变量完全相关,如x2= x1,则,则这时,只能确定综合参数这时,只能确定综合参数 1+2的估计值:的估计值:一个方程确定两个未知数,有无穷多个解。一个方程确定两个未知数,有无穷多个解。2 2、近似共线性下、近似共线性下OLS估计量非有效估计量非有效近似共线性下,可以得到近似共线性下,可以得到O

4、LS参数估计量,参数估计量,但参数估计量但参数估计量方差方差的表达式为的表达式为 由由于于 ,引引起起主主对对角角线线元元素素 较较大大,使使参参数数估估计计值值的的方方差差增增大大,OLS参参数数估估计计量量非非有有效。效。近似共线性指的是解释变量中近似共线性指的是解释变量中某个变量不完全是其他解释变某个变量不完全是其他解释变量的线性组合,还差个扰动项。量的线性组合,还差个扰动项。即即c1X1+c2X2+ckXkvi=0,其中其中ci不全为不全为0,i=1,k 如如果果模模型型中中两两个个解解释释变变量量具具有有线线性性相相关关性性,例如例如 X2= X1 , 这这时时,X1和和X2前前的的

5、参参数数 1、 2并并不不反反映映各各自自与与被被解解释释变变量量之之间间的的结结构构关关系系,而而是是反反映映它它们们对对被被解释变量的共同影响。解释变量的共同影响。 1、 2已已经经失失去去了了应应有有的的经经济济含含义义,于于是是经经常常表表现现出出似似乎乎反反常常的的现现象象:例例如如 1本本来来应应该该是是正正的的,结果恰是负的。结果恰是负的。 3、参数估计量经济含义不合理、参数估计量经济含义不合理注:除非是完全共线性,多重共线性并不意味着任何基本假设的违背。注:除非是完全共线性,多重共线性并不意味着任何基本假设的违背。 多重共线性诊断的任务多重共线性诊断的任务是:是: (1)检验多

6、重共线性是否存在;)检验多重共线性是否存在; (2)估计多重共线性的范围,即判断哪些变量之间)估计多重共线性的范围,即判断哪些变量之间存在共线性。存在共线性。 多重共线性表现为解释变量之间具有相关关系,多重共线性表现为解释变量之间具有相关关系,所以所以用于多重共线性的检验方法主要是统计方法用于多重共线性的检验方法主要是统计方法:如如判定系数检验法判定系数检验法、逐步回归检验、方差膨胀因逐步回归检验、方差膨胀因子(子(VIF)法)法等。等。 三、多重共线性的诊断三、多重共线性的诊断 (1)(1)对两个解释变量的模型,采用对两个解释变量的模型,采用简单相关系数法简单相关系数法 求出求出X1与与X2

7、的简单相关系数的简单相关系数r,若若|r|接近接近1,则说,则说明两变量存在较强的多重共线性。明两变量存在较强的多重共线性。 (2)(2)对多个解释变量的模型,对多个解释变量的模型,采用综合统计检验法采用综合统计检验法 若若 在在OLS法下:法下:R2与与F值较大,但值较大,但t检验值较小检验值较小,说明各解释变量对说明各解释变量对Y的联合线性作用显著,但各解的联合线性作用显著,但各解释变量间存在共线性而使得它们对释变量间存在共线性而使得它们对Y的独立作用不的独立作用不能分辨,故能分辨,故t检验不显著。检验不显著。1、检验多重共线性是否存在、检验多重共线性是否存在 如如果果存存在在多多重重共共

8、线线性性,需需进进一一步步确确定定究究竟竟由由哪哪些些变量引起。变量引起。 2 2、判明存在多重共线性的范围、判明存在多重共线性的范围(1) 判定系数检验法判定系数检验法 使模型中每一个解释变量分别以其余解释变量使模型中每一个解释变量分别以其余解释变量为解释变量进行回归,并计算相应的拟合优度。为解释变量进行回归,并计算相应的拟合优度。 如果某一种回归如果某一种回归 Xji= 1X1i+ 2X2i+kXki的的判定系数判定系数较大,说明较大,说明 X j 与其他与其他X间存在间存在共线性共线性。具体可进一步对上述回归方程作具体可进一步对上述回归方程作F检验:检验: 式中:式中:Rj2为第为第j个

9、解释变量对其他解释变量的回归方程个解释变量对其他解释变量的回归方程的可决系数,的可决系数, 若存在较强的共线性,则若存在较强的共线性,则Rj2较大且接近于较大且接近于1,这时(,这时(1- Rj2 )较小,从而较小,从而Fj的值较大。的值较大。 因此,给定显著性水平因此,给定显著性水平 ,计算,计算F值,并与相应的临界值值,并与相应的临界值比较,来判定是否存在相关性。比较,来判定是否存在相关性。 构造如下构造如下F统计量统计量 在模型中排除某一个解释变量在模型中排除某一个解释变量 X j,估计模估计模型;型; 如果拟合优度与包含如果拟合优度与包含X j时十分接近,则说时十分接近,则说明明X j

10、与其它解释变量之间存在共线性。与其它解释变量之间存在共线性。 另一等价的检验是另一等价的检验是: (2)逐步回归法逐步回归法 以以Y为被解释变量,逐个引入解释变量,构为被解释变量,逐个引入解释变量,构成回归模型,进行模型估计。成回归模型,进行模型估计。 根据拟合优度的变化决定新引入的变量是否根据拟合优度的变化决定新引入的变量是否独立。独立。 如果拟合优度变化显著如果拟合优度变化显著,则说明新引入的变,则说明新引入的变量是一个独立解释变量;量是一个独立解释变量; 如果拟合优度变化很不显著如果拟合优度变化很不显著,则说明新引入,则说明新引入的变量与其它变量之间存在共线性关系。的变量与其它变量之间存

11、在共线性关系。 (3) 方差膨胀因子方差膨胀因子( VIF: Variance Inflation Factor )VIF指标:指标:Xk与其余变量回归所得的可决系数与其余变量回归所得的可决系数VIF范围:范围:+1,+)判断:若判断:若VIF5,则认为多重共线性强,则认为多重共线性强,不可接受。不可接受。 (4) 条件数(条件数(Condition Indix)解释变量的相关矩阵的最大解释变量的相关矩阵的最大特征值与最小特征值相比特征值与最小特征值相比调用数据库调用数据库 neiyun.dta 讲解。讲解。条件数大于条件数大于30,认为多重共线存在。,认为多重共线存在。 找出引起多重共线性的

12、解释变量,将它排除出去。 以逐步回归法逐步回归法得到最广泛的应用。v 注意:注意: 这时,剩余解释变量参数的经济含义和数值都这时,剩余解释变量参数的经济含义和数值都发生了变化。发生了变化。 如果模型被检验证明存在多重共线性,则需要发展新如果模型被检验证明存在多重共线性,则需要发展新的方法估计模型,最常用的方法有三类。的方法估计模型,最常用的方法有三类。 四、克服多重共线性的方法四、克服多重共线性的方法 1、第一类方法:排除引起共线性的变量、第一类方法:排除引起共线性的变量 时间序列数据、线性模型:将原模型变换为差分模型: Yi=1 X1i+2 X2i+k Xki+ i可以有效地消除原模型中的多

13、重共线性。 一般讲,增量之间的线性关系远比总量一般讲,增量之间的线性关系远比总量之间的线性关系弱得多之间的线性关系弱得多。2、第二类方法:差分法、第二类方法:差分法 多重共线性多重共线性的主要的主要后果后果是参数估计量具有较大的是参数估计量具有较大的方差,所以方差,所以 采取适当方法减小参数估计量的方差采取适当方法减小参数估计量的方差,虽然没有,虽然没有消除模型中的多重共线性,但确能消除多重共线性消除模型中的多重共线性,但确能消除多重共线性造成的后果。造成的后果。 例如:例如: 增加样本容量可使参数估计量的方差减小。增加样本容量可使参数估计量的方差减小。 3、第三类方法:减小参数估计量的方差、

14、第三类方法:减小参数估计量的方差 六、案例六、案例中国粮食生产函数中国粮食生产函数 根据理论和经验分析,影响粮食生产(Y)的主要因素有: 农业化肥施用量(X1);粮食播种面积(X2) 成灾面积(X3); 农业机械总动力(X4); 农业劳动力(X5) 已知中国粮食生产的相关数据,建立中国粮食生产函数: Y=0+1 X1 +2 X2 +3 X3 +4 X4 +5 X5 +调用数据库调用数据库E:博士计量课程软件应用博士计量课程软件应用multi R2接近于1; 给定=5%,得F临界值 F0.05(5,12)=3.11 F=137.11 3.11,故认上述粮食生产的总体线性关系显著成立。 但X4 、

15、X5 的参数未通过t检验,且符号不正确,故解释变量间可能存在多重共线性解释变量间可能存在多重共线性。 (-0.91) (8.39) (3.32) (-2.81) (-1.45) (-0.14) 1、用、用OLS法估计上述模型:法估计上述模型:v发现:发现: X1与X4间存在高度相关性。列出X1,X2,X3,X4,X5的相关系数矩阵: 2、检验简单相关系数、检验简单相关系数v可见,应选可见,应选第第1 1个式子个式子为初始的回归模型。为初始的回归模型。分别作Y与X1, X3 ,X2,X4,X5间的回归: (25.58) (11.49) R2=0.8919 F=132.1 (-0.49) (1.1

16、4) R2=0.075 F=1.30 (17.45) (6.68) R2=0.7527 F=48.7 (-1.04) (2.66)R2=0.3064 F=7.07 3、找出最简单的回归形式、找出最简单的回归形式 (1.74) (7.25) R2=0.1596 F=3.04 将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程。 4、逐步回归、逐步回归 回归方程以回归方程以Y=f(Y=f(X1,X2,X3) )为最优:为最优:5、结论、结论 5.2 异方差异方差 ( Heteroscedasticity ) 1、同方差假定及异方差定义、同方差假定及异方差定义模型的假定条件模型的假定条件 给出

17、给出Var( ) 是一个对角矩阵,是一个对角矩阵,Var( ) = 2I = 2 且且 的方差协方差矩阵主对角线上的元素都是常数且相等,的方差协方差矩阵主对角线上的元素都是常数且相等,即每一误差项的方差都是有限的相同值(同方差假定);即每一误差项的方差都是有限的相同值(同方差假定);且非主对角线上的元素为零(无自相关假定),且非主对角线上的元素为零(无自相关假定),Var( ) = 2 = 2 2 I. 当这个假定不成立时,当这个假定不成立时,Var( ) 不再是一个纯量对角矩阵。不再是一个纯量对角矩阵。当误差向量当误差向量 的的方差协方差矩阵主对角线上的元素不相等时方差协方差矩阵主对角线上的

18、元素不相等时,称该随机误差系列存在异方差,即误差向量称该随机误差系列存在异方差,即误差向量 中的元素取中的元素取自不同的分布总体。非主对角线上的元素表示误差项之间的自不同的分布总体。非主对角线上的元素表示误差项之间的协方差值。比如协方差值。比如 中的中的 i j ,(i j)表示与第)表示与第i组和第组和第j组观测组观测值相对应的值相对应的 i与与 j的协方差。若的协方差。若 非主对角线上的部分或全非主对角线上的部分或全部元素都不为零,误差项就是自相关的(后面讲自相关)。部元素都不为零,误差项就是自相关的(后面讲自相关)。 2. 2. 异方差的表现异方差的表现 异方差通常有三种表现形式,异方差

19、通常有三种表现形式,(1 1)递增型()递增型(2 2)递减型()递减型(3 3)条件自回归型。)条件自回归型。递增型异方差见图递增型异方差见图5.215.21和和5.225.22。图。图5.235.23为递减型异方差。为递减型异方差。图图5.245.24为条件自回归型异方差为条件自回归型异方差( (复杂性异方差复杂性异方差) )。图图5.21 5.21 递增型异方差情形递增型异方差情形 图图5.22 5.22 递增型异方差递增型异方差 随着解释变量值的增大,被解释变量取值的差异性增大随着解释变量值的增大,被解释变量取值的差异性增大 图图5.23 5.23 递减型异方差递减型异方差 图图5.6

20、 5.6 复杂型异方差复杂型异方差 注:注: 时间序列数据和截面数据中都有可能存在异方差。时间序列数据和截面数据中都有可能存在异方差。 经济时间序列中的异方差常为递增型异方差。经济时间序列中的异方差常为递增型异方差。 金融时间序列中的异方差常表现为自回归条件异方差。金融时间序列中的异方差常表现为自回归条件异方差。 无论是时间序列数据还是截面数据。递增型异方差的来源无论是时间序列数据还是截面数据。递增型异方差的来源 主要是因为随着解释变量值的增大,被解释变量取值的差异主要是因为随着解释变量值的增大,被解释变量取值的差异 性增大。性增大。 3. 3. 异方差的后果异方差的后果 下面以简单线性回归模

21、型为例讨论异方差对参数估计的影响。下面以简单线性回归模型为例讨论异方差对参数估计的影响。 对模型对模型 yt = 0 + 1 xt + ut (1 1). .当当Var(uVar(ut t) = ) = t t 2 2为异方差时(为异方差时( t t 2 2是一个随时间或序数是一个随时间或序数变化的量),回归参数估计量仍具有无偏性和一致性变化的量),回归参数估计量仍具有无偏性和一致性, ,但是但是回归参数估计量不再具有有效性。回归参数估计量不再具有有效性。以 为例 E( )E( ) = E( )= 1+ = 1Var () = E(- - 1)2 E( )2E( )=上式不等号左侧项分子中的上

22、式不等号左侧项分子中的 t 2不是一个常量,不是一个常量,不能从累加式中提出,所以不等号右侧项不等于不能从累加式中提出,所以不等号右侧项不等于不等号左侧项。而不等号右侧项是同方差条件下不等号左侧项。而不等号右侧项是同方差条件下 1的最小二乘估计量的方差。因此异方差条件下的最小二乘估计量的方差。因此异方差条件下的失去有效性。的失去有效性。4.4.异方差的诊断异方差的诊断 (2)参数估计量的方差估计是真实方差的有偏估计)参数估计量的方差估计是真实方差的有偏估计(3)t 检验失效检验失效(1)经济变量经济变量规模差别很大规模差别很大时容易出现异方差。如个人收时容易出现异方差。如个人收入与支出关系,投

23、入与产出关系。入与支出关系,投入与产出关系。 (2) (2) 利用散点图做初步判断。利用散点图做初步判断。 OLS(3) White检验检验White检验的具体步骤如下:检验的具体步骤如下: 第一步:第一步:Y Xe1,en检验假设:检验假设:H0:即,同方差即,同方差第三步:第三步:第四步:第四步:拒绝拒绝H0,存在异方差。,存在异方差。第二步:第二步:ei2原变量、原变量平方、交叉项原变量、原变量平方、交叉项R2OLS(4)自回归条件异方差()自回归条件异方差(ARCH)检验)检验 异方差的另一种检验方法称作自回归条件异方差异方差的另一种检验方法称作自回归条件异方差 (ARCH) 检验。检

24、验。这种检验方法这种检验方法不是把原回归模型的随机误差项不是把原回归模型的随机误差项 t 2 看作是看作是xt 的函数,的函数,而是把而是把 t 2 看作误差滞后项看作误差滞后项ut-12 , ut-22 , 的函数。的函数。ARCH是误差项二阶矩的自回归过程。恩格尔(是误差项二阶矩的自回归过程。恩格尔(Engle 1982)针对针对ARCH过程提出过程提出LM 检验法。检验法。 辅助回归式定义为:辅助回归式定义为:LM 统计量定义为:统计量定义为:ARCH=nR2检验假设:检验假设:H0: 5. 5. 克服异方差的方法克服异方差的方法 (1)采用)采用GLS估计估计 Y = X + u 设模

25、型为:设模型为:其中其中E(u) = 0,Var(u) = E(u u) = 2 , 已知已知 因为因为 是一个是一个T 阶正定矩阵,所以必存在一个非退化阶正定矩阵,所以必存在一个非退化T T 阶阶矩阵矩阵M使下式成立。使下式成立。 M M = I T TM M = -1 M Y = M X + M u取Y* = M Y, X * = M X, u* = M u Y* = X* + u* 若对于不全为零的实数若对于不全为零的实数x1,x2,xn总有总有f=f(x1,x2,xn)0,则则f称为正称为正定定二次型。二次型。满秩矩阵满秩矩阵 Var(u*) = E(u* u* ) = E (M u

26、u M ) = M 2 M = 2 M M = 2 I(GLS) = (X* X*)-1 X* Y* = (X M M X ) -1 X M M Y = (X -1X) -1 X -1Y 这种方法成为广义最小二乘法(这种方法成为广义最小二乘法(GLS)(2) 通过对数据取对数消除异方差。通过对数据取对数消除异方差。 中国进出口贸易额差(中国进出口贸易额差(1953-1998) 对数的中国进出口贸易额之差对数的中国进出口贸易额之差 5.3 自相关自相关 ( Autocorrelation ) 1. 1. 非自相关的假定及自相关定义非自相关的假定及自相关定义 Cov (ui , uj ) 0, (

27、i j)即误差项即误差项ut的取值在时间上是相互无关的。的取值在时间上是相互无关的。称误差项称误差项ut非自相关。非自相关。 如果如果则称误差项则称误差项ut 存在自相关。存在自相关。注:自相关又称序列相关。注:自相关又称序列相关。 图图1 1 非自相关的散点图非自相关的散点图 图图4 正自相关的散点图正自相关的散点图 图图3 3 负自相关的散点图负自相关的散点图 图图2 非自相关的序列图非自相关的序列图 2.2.自相关产生的原因自相关产生的原因 大大多多数数经经济济时时间间数数据据都都有有一一个个明明显显的的特特点点,就就是是它它的惯性。的惯性。 GDPGDP、价价格格指指数数、生生产产、就

28、就业业与与失失业业等等时时间间序序列列都都呈呈周周期期性性,如如周周期期中中的的复复苏苏阶阶段段,大大多多数数经经济济序序列列均均呈呈上上升升势势,序序列列在在每每一一时时刻刻的的值值都都高高于于前前一一时时刻刻的的值值,似似乎乎有有一一种种内内在在的的动动力力驱驱使使这这一一势势头头继继续续下下去去,直直至至某某些些情况(如利率或课税的升高)出现才把它拖慢下来。情况(如利率或课税的升高)出现才把它拖慢下来。(1)惯性)惯性(2 2)设定偏误)设定偏误1 1:模型中未含应包括的变量:模型中未含应包括的变量 例如例如:如果对牛肉需求的正确模型应为:如果对牛肉需求的正确模型应为Y Yt t= =

29、0 0+ + 1 1X X1t1t+ + 2 2X X2t2t+ + 3 3X X3t3t+ + t t其中:其中:Y=Y=牛肉需求量,牛肉需求量,X X1 1= =牛肉价格,牛肉价格, X X2 2= =消费者收入,消费者收入,X X3 3= =猪肉价格猪肉价格 如果模型设定为:如果模型设定为:Y Yt t= = 0 0+ + 1 1X X1t1t+ + 2 2X X2t2t+v+vt t 则该式中,则该式中,v vt t= = 3 3X X3t3t+ + t,t, 于于是是在在猪猪肉肉价价格格影影响响牛牛肉肉消消费费量量的的情情况况下下,这这种种模模型型设设定定的的偏偏误误往往往往导导致致

30、随随机机项项中中有有一一个个重重要要的的系系统统性性影影响响因因素素,使使其其呈呈序列相关性。序列相关性。 (3)设定偏误设定偏误2 2:不正确的函数形式:不正确的函数形式 例如例如:如果真实的边际成本回归模型应为:如果真实的边际成本回归模型应为: Y Yt t= = 0 0+ + 1 1X Xt t+ + 2 2X Xt t2 2+ + t t其中:其中:Y=Y=边际成本,边际成本,X=X=产出,产出, 但建模时设立了如下模型:但建模时设立了如下模型:Y Yt t= = 0 0+ + 1 1X Xt t+v+vt t 因此,由于因此,由于v vt t= = 2 2X Xt t2 2+ + t

31、,t, ,包含了产出的平方对随机包含了产出的平方对随机项的系统性影响,随机项也呈现序列相关性。项的系统性影响,随机项也呈现序列相关性。(4) 蛛网现象蛛网现象例如例如:农产品供给对价格的反映本身存在一个滞后期:农产品供给对价格的反映本身存在一个滞后期: 供给供给t= 0+ 1价格价格t-1+ t 意味着,农民由于在年度意味着,农民由于在年度t的过量生产(使该期价格下降)的过量生产(使该期价格下降)很可能导致在年度很可能导致在年度t+1时削减产量,因此不能期望随机干扰时削减产量,因此不能期望随机干扰项是随机的,往往产生一种蛛网模式。项是随机的,往往产生一种蛛网模式。3. 3. 自相关性的后果自相

32、关性的后果(1 1)参数估计量非有效)参数估计量非有效 虽然回归系数虽然回归系数 仍具有无偏性。仍具有无偏性。但是但是 丧失有效性丧失有效性。 的方差比的方差比 非自相关非自相关时大,失去有效性。时大,失去有效性。 ( 2) ( 2) 变量的显著性检验失去意义变量的显著性检验失去意义 用用OLS法估计时仍然用法估计时仍然用 估计,估计,所以会低估所以会低估 的方差。的方差。 等于等于过高估计统计量过高估计统计量t t的值,从而把不重要的解的值,从而把不重要的解释变量保留在模型里,使显著性检验失去意义。释变量保留在模型里,使显著性检验失去意义。(3) (3) VarVar( ( )和)和s su

33、 u2 2都变大,都不具有最小方差性。所以都变大,都不具有最小方差性。所以用依据普通最小二乘法得到的回归方程去预测,预测是用依据普通最小二乘法得到的回归方程去预测,预测是无效的。无效的。关于名词白噪声序列:零期望、同方差、无自相关序列。关于名词白噪声序列:零期望、同方差、无自相关序列。 然然后后,通通过过分分析析这这些些“近近似似估估计计量量”之之间间的的相相关关性性,以以达到判断随机误差项是否具有自相关性的目的。达到判断随机误差项是否具有自相关性的目的。基本思路:基本思路:4. 自相关检验自相关检验(1 1)Durbin-Watson Durbin-Watson 检验法检验法 D-W检检验验

34、是是J.Durbin)和和G.S. G.S. WatsonWatson于于19511951年年提提出出的的一一种检验序列自相关的方法,种检验序列自相关的方法,该方法的假定条件是该方法的假定条件是:(1 1)解释变量)解释变量 X X非随机非随机;(2)随机误差项)随机误差项 i为一阶自回归形式为一阶自回归形式: i=i-1+ i(3)回归模型中回归模型中不应含有滞后因变量作为解释变量不应含有滞后因变量作为解释变量,即不,即不 应出现下列形式:应出现下列形式: Yi= 0+ 1X1i+kXki+ Yi-1+ i(4)回归回归含有截距项含有截距项; 该统计量该统计量的分布与出现在给定样本中的X值有

35、复杂的关系,因此其精确的分布很难得到精确的分布很难得到。 D.W.统计量统计量DWDW检验步骤如下。给出假设:检验步骤如下。给出假设: H H0 0: : = 0 = 0 ( ( 不存在自相关不存在自相关) ) H H1 1: : 0 ( 0 ( 存在一阶自相关存在一阶自相关) )用残差值用残差值 e et t计算统计量计算统计量DWDW。 DW = 因为因为 DW = 2(1 )2(1 )因为因为 的取值范围是的取值范围是 -1, 1-1, 1,所以所以DWDW统计量的取值范围是统计量的取值范围是 0, 40, 4。 与与DW值的对应关系见下表。值的对应关系见下表。 DW 的表的表现 = 0

36、DW = 2 非自相关非自相关 = 1DW = 0 完全正自相关完全正自相关 = -1DW = 4 完全完全负自相关自相关实际中实际中DW = 0, 2, 4 的情形是很少见的。当的情形是很少见的。当DW取值在(取值在(0, 2),),(2, 4)之间时,怎样判别误差项)之间时,怎样判别误差项 是否存在自相关呢?是否存在自相关呢?推导统计量推导统计量DW的精确抽样分布是困难的,因为的精确抽样分布是困难的,因为DW是依据是依据残差残差et 计算的,而计算的,而et的值又与的值又与xt的形式有关。的形式有关。DW检验与其检验与其它统计检验不同,它没有唯一的临界值用来制定判别规则。它统计检验不同,它

37、没有唯一的临界值用来制定判别规则。然而然而Durbin-Watson根据样本容量和被估参数个数,在给定根据样本容量和被估参数个数,在给定的显著性水平下,给出了检验用的上、下两个临界值的显著性水平下,给出了检验用的上、下两个临界值dU和和dL 。判别规则如下:判别规则如下: 可以看出,可以看出,当当D.W.值在值在2左右时,模型不存在一阶自相关。左右时,模型不存在一阶自相关。当当DWDW值落在值落在“不确定不确定”区域时,有两种处理方法。区域时,有两种处理方法。加大样本容量或重新选取样本,重作加大样本容量或重新选取样本,重作DWDW检验。检验。选用其它检验方法。选用其它检验方法。注意:注意:因为

38、因为DW统计量是以解释变量非随机为条件得出的,统计量是以解释变量非随机为条件得出的, 所以当有滞后的内生变量作解释变量时,所以当有滞后的内生变量作解释变量时,DW检验无效。检验无效。 不适用于联立方程模型中各方程的序列自相关检验。不适用于联立方程模型中各方程的序列自相关检验。 DW统计量不适用于对高阶自相关的检验。统计量不适用于对高阶自相关的检验。 但在实际计量经济学问题中,一阶自相关是出现最多但在实际计量经济学问题中,一阶自相关是出现最多 的一类序列相关;另外,经验表明,如果不存在一阶的一类序列相关;另外,经验表明,如果不存在一阶 自相关,一般也不存在高阶序列相关。自相关,一般也不存在高阶序

39、列相关。 (2 2)图示法)图示法 图示法就是依据残差图示法就是依据残差e et t 对时间对时间t t的序列图作出判断。的序列图作出判断。由于残差由于残差e et t是对误差项是对误差项u ut t 的估计,所以尽管误差项的估计,所以尽管误差项u ut t 观测不到,但可以通过观测不到,但可以通过e et t的变化判断的变化判断u ut t 是否存在自相关。是否存在自相关。图示法的具体步骤是,图示法的具体步骤是,(1) (1) 用给定的样本估计回归模型,用给定的样本估计回归模型, 计算残差计算残差e et t , (, (t t = 1, 2, = 1, 2, T T) ),绘制残差图;,绘

40、制残差图;(2) (2) 分析残差图。分析残差图。Stata实现语句:实现语句:reg y xpredict r,residualsgen rlagr_n-1Scatter r rlag 调用水果数据库调用水果数据库(3) 回归检验法回归检验法 优点是,(优点是,(1)适合于任何形式的自相关检验,)适合于任何形式的自相关检验, (2)若结论是存在自相关,则同时能)若结论是存在自相关,则同时能 提供出自相关的具体形式与参数的估计值。提供出自相关的具体形式与参数的估计值。缺点是,计算量大。缺点是,计算量大。用给定样本估计模型并计算残差用给定样本估计模型并计算残差et。 对残差序列对残差序列et ,

41、 (t = 1 ,2 , , T ) 用用OLS进行不同形式的回归拟合。如进行不同形式的回归拟合。如 et = et 1 + vt et = 1 et 1 + 2 et 2 + vt et = et- 12 + v t et = + vt (3) (3) 对上述各种拟合形式进行显著性检验,对上述各种拟合形式进行显著性检验,从而确定误差项从而确定误差项u ut t存在哪一种形式的自相关。存在哪一种形式的自相关。回归检验法的步骤如下:回归检验法的步骤如下:5. 5. 克服自相关克服自相关如果模型的误差项存在自相关,首先应分析产生自相关的如果模型的误差项存在自相关,首先应分析产生自相关的原因。如果自

42、相关是由于错误地设定模型的数学形式所致,原因。如果自相关是由于错误地设定模型的数学形式所致,那么就应当修改模型的数学形式。那么就应当修改模型的数学形式。如果自相关是由于模型中省略了重要解释变量造成的,如果自相关是由于模型中省略了重要解释变量造成的,那么解决办法就是找出略去的解释变量,把它做为重那么解决办法就是找出略去的解释变量,把它做为重要解释变量列入模型。要解释变量列入模型。只有当以上两种引起自相关的原因都消除后,才能认为只有当以上两种引起自相关的原因都消除后,才能认为误差项误差项u ut t “真正真正”存在自相关。在这种情况下,解决存在自相关。在这种情况下,解决办法是变换原回归模型,使变

43、换后的随机误差项消除自办法是变换原回归模型,使变换后的随机误差项消除自相关,进而利用普通最小二乘法估计回归参数。这种变相关,进而利用普通最小二乘法估计回归参数。这种变换方法称作广义最小二乘法(换方法称作广义最小二乘法(GLSGLS)。 广义最小二乘法广义最小二乘法 对于模型对于模型 Y=X +N Y=X +N (1) (1) 如果存在序列相关,同时存在异方差,即有如果存在序列相关,同时存在异方差,即有设设 = 用用D-1左乘上式两边,得到一个新的模型:左乘上式两边,得到一个新的模型: D-1 Y=D-1 X +D-1 N 即即 Y*=X* +N* .(2)该模型具有同方差性和随机误差项互相独立

44、性。该模型具有同方差性和随机误差项互相独立性。于是,可以用于是,可以用OLS法估计模型法估计模型(2),得,得 这就是原模型这就是原模型(1)的的广义最小二乘估计量广义最小二乘估计量(GLS estimators),是无偏的、有效的估计量。是无偏的、有效的估计量。如何得到矩阵如何得到矩阵 ?仍然是对原模型仍然是对原模型(1)首先采用普通最小二乘法,首先采用普通最小二乘法,得到随机误差项的得到随机误差项的近似估计量近似估计量,以此构成矩阵的估计量,以此构成矩阵的估计量 ,即,即 差分法差分法 差差分分法法是是一一类类克克服服自自相相关关性性的的有有效效的的方方法法,被被广广泛地采用。泛地采用。

45、差分法差分法是将原模型变换为差分模型,分为是将原模型变换为差分模型,分为一阶差分法一阶差分法(first-difference method)和和广义差分法广义差分法(generalized difference method)。 下面以下面以一元线性模型一元线性模型为例说明。为例说明。 (1)一阶差分法一阶差分法将原模型将原模型变化为变化为其中其中如果原模型存在完全一阶正自相关,即在如果原模型存在完全一阶正自相关,即在 i=i-1+ i中,中, =1。 模型可变换为:模型可变换为: Yi= 1 Xi+ i由于由于 i不存在序列相关,该差分模型满不存在序列相关,该差分模型满足应用足应用OLS法

46、的基本假设法的基本假设; 因此,用因此,用OLS法估计可得到原模型法估计可得到原模型参数的无偏的、有效的估计量。参数的无偏的、有效的估计量。 即使对于非完全一阶正相关的情况,即使对于非完全一阶正相关的情况,只要存在一定程度的一阶正相关,差分只要存在一定程度的一阶正相关,差分模型就可以有效地加以克服。模型就可以有效地加以克服。 (2 2)广义差分法)广义差分法 此模型称为此模型称为广义差分模型广义差分模型,该模型不存在序列相关问,该模型不存在序列相关问题。采用题。采用OLS法估计可以得到原模型参数的无偏、有效法估计可以得到原模型参数的无偏、有效的估计量。的估计量。 广义差分法广义差分法可以克服所

47、有类型的序列相关带来的问题,可以克服所有类型的序列相关带来的问题,一阶差分法是它的一个特例。一阶差分法是它的一个特例。如果原模型存在如果原模型存在可以将原模型变为可以将原模型变为随机误差项相关系数随机误差项相关系数 的估计的估计 应应用用广广义义差差分分法法,必必须须已已知知不不同同样样本本点点之之间间随随机机误误差差项项的的相相关关系系数数 1 1, , 2 2, l l 。实实际际上上,人人们们并并不不知知道它们的具体数值,所以必须首先对它们进行估计。道它们的具体数值,所以必须首先对它们进行估计。 常用的方法有:常用的方法有: (1)科克伦)科克伦-奥科特奥科特(Cochrane-Orcu

48、tt)迭代法迭代法。 (2)杜宾)杜宾(durbin)两步法两步法v(1)科克伦)科克伦-奥科特迭代法。奥科特迭代法。 首先,首先,采用采用OLS法估计原模型法估计原模型 Yi= 0+ 1Xi+ i得到的随机误差项的得到的随机误差项的“近似估计值近似估计值”,并以之作为观测,并以之作为观测值采用值采用OLS法估计下式法估计下式 i= 1 i-1+ 2 i-2+L i-L+ i 类似地,可进行第三次、第四次迭代。类似地,可进行第三次、第四次迭代。 关于迭代的次数,可根据具体的问题来定。关于迭代的次数,可根据具体的问题来定。 一一般般是是事事先先给给出出一一个个精精度度,当当相相邻邻两两次次 1,

49、 2, L的估计值之差小于这一精度时,迭代终止。的估计值之差小于这一精度时,迭代终止。 实实践践中中,有有时时只只要要迭迭代代两两次次,就就可可得得到到较较满满意意的的结结果果。两次迭代过程也被称为两次迭代过程也被称为科克伦科克伦-奥科特两步法奥科特两步法。(2)杜宾()杜宾(durbin)两步法两步法 该方法仍是先估计该方法仍是先估计 1, 2, L,再对差分模型进行再对差分模型进行估计估计第一步,变换差分模型为下列形式:第一步,变换差分模型为下列形式:某地区商品出口总值与国内生产总值的关系研究。某地区商品出口总值与国内生产总值的关系研究。五、案例:地区商品出口模型五、案例:地区商品出口模型调用数据库调用数据库E:博士计量课程软件应用博士计量课程软件应用export-gdp 1、检验、检验 (1)图示法检验)图示法检验(2)D.W.D.W.检验:检验: 在5%在显著性水平下,n=19,k=2(包含常数项),查表得dL=1.18,dU=1.40, 由于DW=0.9505du=1.39(注:样本容量为18个),已不存在自相关。 (2)广义差分法:广义差分法: 采用杜宾两步法估计采用杜宾两步法估计 由于DW=1.39(注:样本容量为19-1=18个),已不存在自相关。于是原模型估计式为:于是原模型估计式为:调用数据库程序:调用数据库程序:multi-hetro-autoco

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号