4.3多重共线性

上传人:博****1 文档编号:571033107 上传时间:2024-08-08 格式:PPT 页数:37 大小:1.20MB
返回 下载 相关 举报
4.3多重共线性_第1页
第1页 / 共37页
4.3多重共线性_第2页
第2页 / 共37页
4.3多重共线性_第3页
第3页 / 共37页
4.3多重共线性_第4页
第4页 / 共37页
4.3多重共线性_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《4.3多重共线性》由会员分享,可在线阅读,更多相关《4.3多重共线性(37页珍藏版)》请在金锄头文库上搜索。

1、 教学内容教学内容一、一、多重共线性多重共线性二、二、实际经济问题中的多重共线性实际经济问题中的多重共线性三、三、多重共线性的后果多重共线性的后果四、四、多重共线性的检验多重共线性的检验五、五、克服多重共线性的办法和实例克服多重共线性的办法和实例4.3 多重多重共线性共线性8/8/20241商学院 王中昭对于模型对于模型对于模型对于模型 Y Yi i=0 0+ + 1 1x x1i1i+ + 2 2x x2i2i+ + k kx xkiki+i i如果某两个或多个解释变量之间出现相关性,即:如果某两个或多个解释变量之间出现相关性,即:如果某两个或多个解释变量之间出现相关性,即:如果某两个或多个

2、解释变量之间出现相关性,即: C C1 1x x1i1i+C+C2 2X X2i2i+C Ck kX Xkiki=0=0其中其中其中其中C Ci i不全为不全为不全为不全为0 0,即某一个解释变量是其他解释变量的,即某一个解释变量是其他解释变量的,即某一个解释变量是其他解释变量的,即某一个解释变量是其他解释变量的线性组合,则称为完全多重共线性。线性组合,则称为完全多重共线性。线性组合,则称为完全多重共线性。线性组合,则称为完全多重共线性。完全多重共线性的情况并不多见,一般是出现不同程完全多重共线性的情况并不多见,一般是出现不同程完全多重共线性的情况并不多见,一般是出现不同程完全多重共线性的情况

3、并不多见,一般是出现不同程度的多重共线性。度的多重共线性。度的多重共线性。度的多重共线性。注意多重共线性不注意多重共线性不是指因变量与解释是指因变量与解释变量之间存在线性变量之间存在线性关系。关系。一、多重共线性概念一、多重共线性概念8/8/20242商学院 王中昭n nY=X+n n完全共线性完全共线性: XX =0,(XX)-1不存在,不存在,n n使使 B=(XX)-1XY 无法求解。无法求解。n n例如:例如:完全多重共线性完全多重共线性8/8/20243商学院 王中昭n n完全多重共线性的情况不多,一般出现不同程完全多重共线性的情况不多,一般出现不同程完全多重共线性的情况不多,一般出

4、现不同程完全多重共线性的情况不多,一般出现不同程度的多重共线性。度的多重共线性。度的多重共线性。度的多重共线性。n n多重共线性多重共线性多重共线性多重共线性:XX0,(XX):XX0,(XX):XX0,(XX):XX0,(XX)-1-1-1-1存在,但存在,但存在,但存在,但(XX)(XX)(XX)(XX)-1-1-1-1主对角线上的元素很大。主对角线上的元素很大。主对角线上的元素很大。主对角线上的元素很大。近似多重共线性近似多重共线性8/8/20244商学院 王中昭1 1 1 1、各各各各时时时时间间间间序序序序列列列列的的的的解解解解释释释释变变变变量量量量受受受受同同同同一一一一因因因

5、因素素素素影影影影响响响响,导导导导致致致致解解解解释释释释变变变变量量量量之之之之间间间间在在在在时时时时间间间间上上上上具具具具有有有有相相相相同同同同近近近近似似似似同同同同增增增增量量量量的的的的变变变变化化化化,这这这这些因素有:些因素有:些因素有:些因素有:(1) (1) (1) (1) 经济发展经济发展经济发展经济发展(2) (2) (2) (2) 政治事件政治事件政治事件政治事件(3) (3) (3) (3) 偶然事件偶然事件偶然事件偶然事件(4) (4) (4) (4) 时间趋势时间趋势时间趋势时间趋势 2 2 2 2、解释变量中含有滞后变量容易产生多重共线性。、解释变量中含

6、有滞后变量容易产生多重共线性。、解释变量中含有滞后变量容易产生多重共线性。、解释变量中含有滞后变量容易产生多重共线性。 这这这这是是是是因因因因为为为为滞滞滞滞后后后后变变变变量量量量从从从从经经经经济济济济性性性性质质质质上上上上看看看看与与与与原原原原来来来来的的的的变变变变量量量量无区别,只是时间上有所不同。无区别,只是时间上有所不同。无区别,只是时间上有所不同。无区别,只是时间上有所不同。 例如,投资模型例如,投资模型例如,投资模型例如,投资模型 I I I It t t t=1 1 1 1+2 2 2 2r r r rt t t t+3 3 3 3Y Y Y Yt t t t+4 4

7、 4 4Y Y Y Yt-1t-1t-1t-1+t t t t I I I It t t t= = = =投资,投资,投资,投资,r r r rt t t t= = = =利率,利率,利率,利率,Y Y Y Yt t t t= = = =当期当期当期当期GDPGDPGDPGDP,Y Y Y Yt-1t-1t-1t-1= = = =上期上期上期上期GDPGDPGDPGDP,二、实际经济问题中的多重共线性二、实际经济问题中的多重共线性8/8/20245商学院 王中昭 如农业生产函数如农业生产函数如农业生产函数如农业生产函数Y=Y=0 0+1 1X X1 1+2 2X X2 2+3 3X X3 3+

8、4 4X X4 4+u+u其中其中其中其中Y Y为粮食产量,为粮食产量,为粮食产量,为粮食产量,X X1 1为肥料,为肥料,为肥料,为肥料,X X2 2为种植面积,为种植面积,为种植面积,为种植面积,X X3 3为劳动力,为劳动力,为劳动力,为劳动力,X X4 4为水利浇灌。种植面积越多则投入的肥料和劳动力就越多,故肥为水利浇灌。种植面积越多则投入的肥料和劳动力就越多,故肥为水利浇灌。种植面积越多则投入的肥料和劳动力就越多,故肥为水利浇灌。种植面积越多则投入的肥料和劳动力就越多,故肥料、种植面积和劳动力三者之间存在相关关系。料、种植面积和劳动力三者之间存在相关关系。料、种植面积和劳动力三者之间

9、存在相关关系。料、种植面积和劳动力三者之间存在相关关系。 又如:又如:又如:又如:Y=Y=0 0+1 1P+P+2 2Q+Q+3 3I+uI+u其中其中其中其中Y Y为某种商品需求量,为某种商品需求量,为某种商品需求量,为某种商品需求量,P P为商品价格、为商品价格、为商品价格、为商品价格、QQ为商品质量、为商品质量、为商品质量、为商品质量、I I为居为居为居为居民收入。一般地质量较高的商品其价格也高,故民收入。一般地质量较高的商品其价格也高,故民收入。一般地质量较高的商品其价格也高,故民收入。一般地质量较高的商品其价格也高,故P P和和和和QQ存在线性存在线性存在线性存在线性关系。关系。关系

10、。关系。 一般地时间序列往往导致多重共线性。一般地时间序列往往导致多重共线性。一般地时间序列往往导致多重共线性。一般地时间序列往往导致多重共线性。但单独用截面数据,或用时间序列和截面数据相结合可减少多重但单独用截面数据,或用时间序列和截面数据相结合可减少多重但单独用截面数据,或用时间序列和截面数据相结合可减少多重但单独用截面数据,或用时间序列和截面数据相结合可减少多重共线性的发生。共线性的发生。共线性的发生。共线性的发生。3、各经济变量之间的内在联系、各经济变量之间的内在联系8/8/20246商学院 王中昭 B=(XX)B=(XX)-1-1XY, XY, Var(BVar(B )=)=2 2(

11、XX)(XX)-1-1 1 1、完完全全共共线线性性:无无法法求求解解参参数数估估计计量量 BB。 2 2、近近似似共共线线性性:(参参数数估估计计量量的的方方差差增增大大为为主主要要后后果果): 即即Var(BVar(B ) )变变得得很很大大,导致导致B B 不稳定不稳定, , 。 3 3、参参数数估估计计量量经经济济含含义义不不合合理理(共共线线性性的的解解释释变变量量的的系系数数并并不不表表示示它它们们各各自自对对被被解解释释变变量量的的贡贡献献,失失去去了了应应有有的的经经济济含含义义。因因为为共共线线解解释释变变量量之之间间可可互互相相线线性性表表示,此系数有可能是它们的共同影响)

12、。示,此系数有可能是它们的共同影响)。?三、多重共线性的后果三、多重共线性的后果8/8/20247商学院 王中昭 4 4、变变量量的的显显著著性性检检验验失失去去意意义义:由由于于系系数数的的标标准准差差变变大大,从从而而该该系系数数对对应应变变量量t t统统计计量量变变小小,故故使使原原本本重要的自变量而重要的自变量而t t检验通不过。检验通不过。 5 5、预预测测功功能能失失效效:因因为为I 值值不不稳稳定定,从从而而导导致致SE不不准准确确, 预预测测不准确。不准确。8/8/20248商学院 王中昭(一)、整体检验(一)、整体检验X1,X2,.,Xk是否是否存在多重共线性。存在多重共线性

13、。FF 若若R R2 2,F,F均均很很大大, ,而而各各自自变变量量的的t t统统计计量量均均偏小偏小, ,则认为存在多重共线性。因为则认为存在多重共线性。因为。 缺缺点点:此此法法无无法法分分辩辩出出共共线线性性由由哪哪些些解解释释变变量量引引起起,在在此此基基础础上上须须进进行行下下面面进进一一步检验:步检验:四、多重共线性的检验四、多重共线性的检验8/8/20249商学院 王中昭 1 1、简简单单相相关关系系数数法法( (只只有有两两个个解解释释变变量量时时用)用)n n(1 1)当当只只有有两两个个自自变变量量时时,计计算算这这两两个个变变量量的的相相关关系系数数,若若系系数数绝绝对

14、对值值较较大大。例例如如大大于于被被解解释释变变量量与与解解释释变变量量之之间间的的相相关关系系数数R R的绝对值。则认为这两个变量存在共线性。的绝对值。则认为这两个变量存在共线性。 (二)具体检验共线性是哪些变量引起的(二)具体检验共线性是哪些变量引起的 那那就就简简单单了了:只只要要算算出出任任何何两两个个变变量量的的相相关关系系数数不不就就知知道道是是否否存存在多重共线性了?在多重共线性了?如如果果是是三三个个以以上上的的解解释释变变量量,此此法法行行不通!懂吗!不通!懂吗!8/8/202410商学院 王中昭(2)但但如如果果有有三三个个以以上上的的解解释释变变量量,则则不不能能用用求求

15、两两两两相相关关系系数数来来判判断断它它们们是是否否存存在在共共线线性性。这这是是因因为为它它们们若若存存在在共共线线性性,并并不不能能由由相相关关系系数数看看出出,即即尽尽管管共共线线性性程程度度很高,但它们的相关系数绝对值未必大。很高,但它们的相关系数绝对值未必大。8/8/202411商学院 王中昭(1 1)将某个解释变量)将某个解释变量)将某个解释变量)将某个解释变量X Xj j与其余的解释变量进行回归:与其余的解释变量进行回归:与其余的解释变量进行回归:与其余的解释变量进行回归: X X1 1=f (X=f (X2 2,X,X3 3,X Xk k) ) X X2 2=f (X=f (X

16、1 1,X,X3 3,X Xk k) ) X Xp p=f (X=f (X1 1,X,X2 2,X,Xk-1k-1) ) 然后算出每个回归方程的判定系数然后算出每个回归方程的判定系数然后算出每个回归方程的判定系数然后算出每个回归方程的判定系数R R2 21 1,R R2 22 2, ,R R2 2k k. .。 在这些系数中找出最大的,如果最大的判定系数比较在这些系数中找出最大的,如果最大的判定系数比较在这些系数中找出最大的,如果最大的判定系数比较在这些系数中找出最大的,如果最大的判定系数比较大(接近于大(接近于大(接近于大(接近于1 1),比如说是),比如说是),比如说是),比如说是R R2

17、 2j j,则表明则表明则表明则表明X Xj j与其它解释变量与其它解释变量与其它解释变量与其它解释变量产生多重共线性。此法不仅能判断出多重共线存在,而且产生多重共线性。此法不仅能判断出多重共线存在,而且产生多重共线性。此法不仅能判断出多重共线存在,而且产生多重共线性。此法不仅能判断出多重共线存在,而且进一步知道是哪个变量与其它变量产生多重共线性。进一步知道是哪个变量与其它变量产生多重共线性。进一步知道是哪个变量与其它变量产生多重共线性。进一步知道是哪个变量与其它变量产生多重共线性。2、判定系数方法、判定系数方法8/8/202412商学院 王中昭(2 2)或者,在对原模型进行估计时,)或者,在

18、对原模型进行估计时,Yi=0+ 1x1i+ 2x2i+ kxki+i将将Xj从模型中剔除,并不引起拟合优度的从模型中剔除,并不引起拟合优度的减少许多,那么,这个被排除在模型之外的减少许多,那么,这个被排除在模型之外的解释变量与留在模型中的解释变量存在多重解释变量与留在模型中的解释变量存在多重共线。排除是应当的。共线。排除是应当的。8/8/202413商学院 王中昭此法与判定系数法原理一样。此法与判定系数法原理一样。将某个解释变量将某个解释变量Xj与其余的解释变量进行回归:与其余的解释变量进行回归:3、方差扩大因子法、方差扩大因子法8/8/202414商学院 王中昭逐步回归法分为逐个剔除法与逐个

19、引入法逐步回归法分为逐个剔除法与逐个引入法 逐步指的是在使用回归分析方法建立模逐步指的是在使用回归分析方法建立模型时,一次只能剔除(减少)一个解释变型时,一次只能剔除(减少)一个解释变量或者一次只能引入(增加)一个解释变量或者一次只能引入(增加)一个解释变量。进行一次剔除或引入称为量。进行一次剔除或引入称为“一步一步”,这样逐步的进行下去,直到最后得到模型这样逐步的进行下去,直到最后得到模型达到最优。达到最优。 下面详细说明:下面详细说明:4、逐步回归法、逐步回归法以下的以下的R2可用可用R2来代替来代替8/8/202415商学院 王中昭 剔除解释变量后不会使模型的拟合优度剔除解释变量后不会使

20、模型的拟合优度剔除解释变量后不会使模型的拟合优度剔除解释变量后不会使模型的拟合优度R R2 2(及(及(及(及F F)显著)显著)显著)显著地减少,并且没有改变模型中的其它自变量的原来地减少,并且没有改变模型中的其它自变量的原来地减少,并且没有改变模型中的其它自变量的原来地减少,并且没有改变模型中的其它自变量的原来t t 统计量统计量统计量统计量性质(即原来显著的仍然显著,未显著的仍未显著)性质(即原来显著的仍然显著,未显著的仍未显著)性质(即原来显著的仍然显著,未显著的仍未显著)性质(即原来显著的仍然显著,未显著的仍未显著), ,或者或者或者或者是其他的统计量有所改善是其他的统计量有所改善是

21、其他的统计量有所改善是其他的统计量有所改善 ,则应当剔除该变量;否则不剔除。,则应当剔除该变量;否则不剔除。,则应当剔除该变量;否则不剔除。,则应当剔除该变量;否则不剔除。 如果剔除一个解释变量,使模型拟合优度如果剔除一个解释变量,使模型拟合优度如果剔除一个解释变量,使模型拟合优度如果剔除一个解释变量,使模型拟合优度R R2 2(及(及(及(及F F)显)显)显)显著地减少,那么这个剔除是不应当的。说明该被剔除变量与著地减少,那么这个剔除是不应当的。说明该被剔除变量与著地减少,那么这个剔除是不应当的。说明该被剔除变量与著地减少,那么这个剔除是不应当的。说明该被剔除变量与留在模型中的解释变量不构

22、成多重共线性。它对被解释变量留在模型中的解释变量不构成多重共线性。它对被解释变量留在模型中的解释变量不构成多重共线性。它对被解释变量留在模型中的解释变量不构成多重共线性。它对被解释变量Y Y的贡献不能由已在模型中的解释变量代替(线性表出)。的贡献不能由已在模型中的解释变量代替(线性表出)。的贡献不能由已在模型中的解释变量代替(线性表出)。的贡献不能由已在模型中的解释变量代替(线性表出)。 具体做法:具体做法:具体做法:具体做法: 先将一切可能的解释变量全部引入模型,先将一切可能的解释变量全部引入模型,先将一切可能的解释变量全部引入模型,先将一切可能的解释变量全部引入模型,再依据各个解释变量的显

23、著性和经济意义,每次从模型中剔再依据各个解释变量的显著性和经济意义,每次从模型中剔再依据各个解释变量的显著性和经济意义,每次从模型中剔再依据各个解释变量的显著性和经济意义,每次从模型中剔除一个不显著的解释变量,即从不显著的解释变量中,剔除除一个不显著的解释变量,即从不显著的解释变量中,剔除除一个不显著的解释变量,即从不显著的解释变量中,剔除除一个不显著的解释变量,即从不显著的解释变量中,剔除t t 最小(或对应的概率最小(或对应的概率最小(或对应的概率最小(或对应的概率ProbProb最大)和从经济意义上看最不重最大)和从经济意义上看最不重最大)和从经济意义上看最不重最大)和从经济意义上看最不

24、重要的解释变量,再根据上面所讲的要的解释变量,再根据上面所讲的要的解释变量,再根据上面所讲的要的解释变量,再根据上面所讲的剔除的准则剔除的准则剔除的准则剔除的准则进行判断是否进行判断是否进行判断是否进行判断是否能剔除该解释变量。能剔除该解释变量。能剔除该解释变量。能剔除该解释变量。直至留在模型中的全部解释变量显著,直至留在模型中的全部解释变量显著,直至留在模型中的全部解释变量显著,直至留在模型中的全部解释变量显著,得到最简洁的模型。得到最简洁的模型。得到最简洁的模型。得到最简洁的模型。剔除的准则:剔除的准则:8/8/202416商学院 王中昭 引入解释变量后使模型的拟合优度引入解释变量后使模型

25、的拟合优度引入解释变量后使模型的拟合优度引入解释变量后使模型的拟合优度R R2 2(及(及(及(及F F)显著增加的,并)显著增加的,并)显著增加的,并)显著增加的,并且没有改变模型中的自变量的原来且没有改变模型中的自变量的原来且没有改变模型中的自变量的原来且没有改变模型中的自变量的原来t t 统计量(原来显著的仍然显统计量(原来显著的仍然显统计量(原来显著的仍然显统计量(原来显著的仍然显著,未显著的仍未显著),或者是其他的统计量有所改善著,未显著的仍未显著),或者是其他的统计量有所改善著,未显著的仍未显著),或者是其他的统计量有所改善著,未显著的仍未显著),或者是其他的统计量有所改善 ,则应

26、,则应,则应,则应当引入,否则不引入。当引入,否则不引入。当引入,否则不引入。当引入,否则不引入。 如果引入解释变量,使模型拟合优度不显著地增加,并且其如果引入解释变量,使模型拟合优度不显著地增加,并且其如果引入解释变量,使模型拟合优度不显著地增加,并且其如果引入解释变量,使模型拟合优度不显著地增加,并且其他的统计量也没有改善他的统计量也没有改善他的统计量也没有改善他的统计量也没有改善 ,那么这个引入是不应当的,说明它与已,那么这个引入是不应当的,说明它与已,那么这个引入是不应当的,说明它与已,那么这个引入是不应当的,说明它与已在模型中的解释变量构成多重共线性,它可由这些解释变量线性在模型中的

27、解释变量构成多重共线性,它可由这些解释变量线性在模型中的解释变量构成多重共线性,它可由这些解释变量线性在模型中的解释变量构成多重共线性,它可由这些解释变量线性表出。也就是说,它对被解释变量的贡献已由这些共线变量代替。表出。也就是说,它对被解释变量的贡献已由这些共线变量代替。表出。也就是说,它对被解释变量的贡献已由这些共线变量代替。表出。也就是说,它对被解释变量的贡献已由这些共线变量代替。所以,引入它并不能提高拟合优度。所以,引入它并不能提高拟合优度。所以,引入它并不能提高拟合优度。所以,引入它并不能提高拟合优度。 具体做法:首先根据经济理论引入一个最重要的解具体做法:首先根据经济理论引入一个最

28、重要的解具体做法:首先根据经济理论引入一个最重要的解具体做法:首先根据经济理论引入一个最重要的解释变量,然后根据上面的释变量,然后根据上面的释变量,然后根据上面的释变量,然后根据上面的引入准则引入准则引入准则引入准则进行引入其它解释变进行引入其它解释变进行引入其它解释变进行引入其它解释变量。量。量。量。引入准则:引入准则:8/8/202417商学院 王中昭 一一一一般般般般来来来来说说说说,模模模模型型型型的的的的多多多多重重重重共共共共线线线线性性性性程程程程度度度度多多多多少少少少都都都都会会会会有有有有一一一一些些些些,如如如如果果果果是是是是轻轻轻轻微微微微的的的的则则则则不不不不必必

29、必必处处处处理理理理;如如如如果果果果是是是是严严严严重重重重,导导导导致致致致参参参参数数数数的的的的符符符符号号号号及及及及大大大大小小小小不不不不符符符符合合合合经经经经济济济济理理理理论论论论时时时时才才才才进进进进行行行行处理。处理。处理。处理。1 1、剔除共线性变量、剔除共线性变量2 2、差分法、差分法3 3、改用相对变量的形式、改用相对变量的形式4 4、减小参数估计量的方差减小参数估计量的方差5 5、对样本处理、对样本处理五、克服多重共线性的方法和实例五、克服多重共线性的方法和实例8/8/202418商学院 王中昭原则:将原则:将原则:将原则:将X Xj j从模型中剔除,并不引起

30、拟合优度从模型中剔除,并不引起拟合优度从模型中剔除,并不引起拟合优度从模型中剔除,并不引起拟合优度R R2 2显著地减少,并显著地减少,并显著地减少,并显著地减少,并且且且且每个变量的每个变量的每个变量的每个变量的t t t t统计量变化不大统计量变化不大统计量变化不大统计量变化不大, , , ,则删除该变量是合理的则删除该变量是合理的则删除该变量是合理的则删除该变量是合理的; ; ; ;做法如下:做法如下:做法如下:做法如下:估计所有变量的模型:估计所有变量的模型:估计所有变量的模型:估计所有变量的模型:Y=f (XY=f (X1 1,X,X2 2,X,Xk k) ), 算出算出算出算出R

31、R2 2去掉去掉去掉去掉X X1 1: Y=f (X Y=f (X2 2,X,Xk k) ) ,算出,算出,算出,算出R R2 21 1去掉去掉去掉去掉X X2 2: Y=f (X Y=f (X1 1, X X3 3,X,Xk k) ),算出,算出,算出,算出R R2 22 2去掉去掉去掉去掉X Xk k: Y=f (X Y=f (X2 2,X,Xk-1k-1) ),算出,算出,算出,算出R R2 2k k找出决定系数最大的找出决定系数最大的找出决定系数最大的找出决定系数最大的R R2 2j j, , 如果如果如果如果R R2 2j j很接近于很接近于很接近于很接近于R R2 2,说明,说明,

32、说明,说明X Xj j可以由其可以由其可以由其可以由其它变量代替。可以去掉它变量代替。可以去掉它变量代替。可以去掉它变量代替。可以去掉X Xj j,一直下去最后得到较好的模型。,一直下去最后得到较好的模型。,一直下去最后得到较好的模型。,一直下去最后得到较好的模型。MM注意,消除共线性变量以后,保留在模型中变量的经济意义不再注意,消除共线性变量以后,保留在模型中变量的经济意义不再注意,消除共线性变量以后,保留在模型中变量的经济意义不再注意,消除共线性变量以后,保留在模型中变量的经济意义不再仅仅是自身的作用,也包含与其共线性并被排除变量的作用仅仅是自身的作用,也包含与其共线性并被排除变量的作用仅

33、仅是自身的作用,也包含与其共线性并被排除变量的作用仅仅是自身的作用,也包含与其共线性并被排除变量的作用。1 1、剔除、剔除引起多重共线性的变量引起多重共线性的变量8/8/202419商学院 王中昭n n差分能消除多重共线性的机理差分能消除多重共线性的机理差分能消除多重共线性的机理差分能消除多重共线性的机理差分减弱了比例关系。差分减弱了比例关系。差分减弱了比例关系。差分减弱了比例关系。n n一般说来,增量间的线性关系弱于总量间的线性关系(详见下页)一般说来,增量间的线性关系弱于总量间的线性关系(详见下页)一般说来,增量间的线性关系弱于总量间的线性关系(详见下页)一般说来,增量间的线性关系弱于总量

34、间的线性关系(详见下页)。所以,对于时间序列数据,通常将直接的线性模型转换为差分。所以,对于时间序列数据,通常将直接的线性模型转换为差分。所以,对于时间序列数据,通常将直接的线性模型转换为差分。所以,对于时间序列数据,通常将直接的线性模型转换为差分形式进行估计。形式进行估计。形式进行估计。形式进行估计。 此法可同时消除多重共线性与序列相关,是一种较好方法。此法可同时消除多重共线性与序列相关,是一种较好方法。此法可同时消除多重共线性与序列相关,是一种较好方法。此法可同时消除多重共线性与序列相关,是一种较好方法。n n 方法一(一阶差分):方法一(一阶差分):方法一(一阶差分):方法一(一阶差分)

35、:方法二:广义差分,方法二:广义差分,例如对于一元线性模型其广义差分例如对于一元线性模型其广义差分例如对于一元线性模型其广义差分例如对于一元线性模型其广义差分模型为:模型为:模型为:模型为:Y Yi i-Y-Yi-1i-1=a=a0 0+a+a1 1(X(Xi i-X-Xi-1i-1)+)+i i2、差分法、差分法8/8/202420商学院 王中昭可以可以算出算出C与与Y的的相关相关系数系数比比Y与与C的高的高。8/8/202421商学院 王中昭例如对于一元线性模型例如对于一元线性模型Yi= a0+a1Xi+i 1、其一阶差分模型为:、其一阶差分模型为:Yi-Yi-1=a1(Xi-Xi-1)+

36、in n命令方式:命令方式:LS d(Y) d(X)n n2、其广义差分模型为:、其广义差分模型为:n nYi-Yi-1=a0+a1(Xi-Xi-1)+in n先估计先估计Yi= a0+a1Xi+i 求出求出n n然后输入命令:然后输入命令:LS Y- *Y(-1) C X- *X(-1)n n其还原形式为:其还原形式为:在在EViews中实现差分模型的估计中实现差分模型的估计8/8/202422商学院 王中昭实例(实例(P124):中国粮食生产函数):中国粮食生产函数 根根根根据据据据理理理理论论论论和和和和经经经经验验验验分分分分析析析析,影影影影响响响响粮粮粮粮食食食食生生生生产产产产(

37、Y Y)的的的的主要因素有:主要因素有:主要因素有:主要因素有: 农业化肥施用量(农业化肥施用量(农业化肥施用量(农业化肥施用量(X X1 1),粮食播种面积),粮食播种面积),粮食播种面积),粮食播种面积(X(X2 2) ) ,成成成成灾灾灾灾面面面面积积积积(X(X3 3) ) , 农农农农业业业业机机机机械械械械总总总总动动动动力力力力(X(X4 4) ), 农农农农业业业业劳动力劳动力劳动力劳动力(X(X5 5) )。 已知中国粮食生产的相关数据,建立中国粮食已知中国粮食生产的相关数据,建立中国粮食已知中国粮食生产的相关数据,建立中国粮食已知中国粮食生产的相关数据,建立中国粮食生产函数

38、:生产函数:生产函数:生产函数: Y= Y= 0 0+ + 1 1 X X1 1 + + 2 2 X X2 2 + + 3 3 X X3 3 + + 4 4 X X4 4 + + 4 4 X X5 5 + + 经验方法:可以通过每个解释变量与经验方法:可以通过每个解释变量与经验方法:可以通过每个解释变量与经验方法:可以通过每个解释变量与Y Y之间的之间的之间的之间的散点图来判断是否为直线关系,然后假定合一起散点图来判断是否为直线关系,然后假定合一起散点图来判断是否为直线关系,然后假定合一起散点图来判断是否为直线关系,然后假定合一起也是直线关系,最后由估计出来的结果再整体检也是直线关系,最后由估

39、计出来的结果再整体检也是直线关系,最后由估计出来的结果再整体检也是直线关系,最后由估计出来的结果再整体检验所有解释变量是否与验所有解释变量是否与验所有解释变量是否与验所有解释变量是否与Y Y线相关线相关线相关线相关。8/8/202423商学院 王中昭8/8/202424商学院 王中昭1. 用用OLS法估计上述模型:法估计上述模型: (-0.91) (8.39) (3.32) (-2.81) (-1.45) (-(-0.91) (8.39) (3.32) (-2.81) (-1.45) (-0.14)0.14)Prob 0.38 0 0.006 0.016 0.17 0.89Prob 0.38

40、0 0.006 0.016 0.17 0.89R R2 2接近于接近于接近于接近于1 1; 给定给定给定给定 =5%=5%,得,得,得,得F F临界值临界值临界值临界值 F F0.050.05(5,12)=3.11 (5,12)=3.11 。 F=137.11 3.11 F=137.11 3.11,故认上述粮,故认上述粮,故认上述粮,故认上述粮食生产的总体线性关系显著成立。食生产的总体线性关系显著成立。食生产的总体线性关系显著成立。食生产的总体线性关系显著成立。 但但但但X X4 4 、X X5 5 的参数未通过的参数未通过的参数未通过的参数未通过t t检验,且符号不正确,检验,且符号不正确,

41、检验,且符号不正确,检验,且符号不正确,故解释变量间可能存在多重共线性,下面进一步故解释变量间可能存在多重共线性,下面进一步故解释变量间可能存在多重共线性,下面进一步故解释变量间可能存在多重共线性,下面进一步检验。检验。检验。检验。8/8/202425商学院 王中昭2、用、用VIF来检验多重共线性来检验多重共线性X X1 1=-3175.18-0.00197X=-3175.18-0.00197X2 2-0.0101X-0.0101X3 3+0.0845X+0.0845X4 4 +0.1183X+0.1183X5 5R R2 2=0.94, =0.94, 调整后的调整后的调整后的调整后的R R2

42、 2=0.92=0.92。VIFVIFx1x1=16.67=16.67。X X2 2=100790.3-0.0674X=100790.3-0.0674X1 1-0.289X-0.289X3 3+0.0754X+0.0754X4 4 +0.478X+0.478X5 5R R2 2=0.42, VIF=0.42, VIFx2x2=1.72=1.72。同理可算出:同理可算出:同理可算出:同理可算出: VIF VIFx3x3=3.18=3.18, VIF VIFx4x4=20=20, VIFVIFx5x5=1.71=1.71,说明说明说明说明X X4 4和其它解释变量的线性关系比较严重。和其它解释变量

43、的线性关系比较严重。和其它解释变量的线性关系比较严重。和其它解释变量的线性关系比较严重。8/8/202426商学院 王中昭3.3.多重共线性处理:用逐步回归法。多重共线性处理:用逐步回归法。首先找出最简单的回归形式首先找出最简单的回归形式可见,第一式子拟合较好,而且从经济意义来看可见,第一式子拟合较好,而且从经济意义来看可见,第一式子拟合较好,而且从经济意义来看可见,第一式子拟合较好,而且从经济意义来看X X1 1也是比较重要的变量。所以应选第一个式子为也是比较重要的变量。所以应选第一个式子为也是比较重要的变量。所以应选第一个式子为也是比较重要的变量。所以应选第一个式子为初始的回归模型。初始的

44、回归模型。初始的回归模型。初始的回归模型。 分别作分别作分别作分别作Y Y与与与与X X1 1,X X2 2,X X4 4,X X5 5间的回归:间的回归:间的回归:间的回归: (25.58) (11.49) R2=0.8919,F=132.1,DW=1.56 (-0.49) (1.14) R2=0.075,F=1.30,DW=0.12 (17.45) (6.68) R2=0.7527,F=48.7,DW=1.11 (-1.04) (2.66)R2=0.3064,F=7.07,DW=0.368/8/202427商学院 王中昭 逐步回归,其结果如下:逐步回归,其结果如下: 将将将将其其其其他他他

45、他解解解解释释释释变变变变量量量量分分分分别别别别导导导导入入入入上上上上述述述述初初初初始始始始回回回回归归归归模模模模型型型型,寻找最佳回归方程。寻找最佳回归方程。寻找最佳回归方程。寻找最佳回归方程。CX1X2X3X4X52RDWY=f(X 1)308684.230.88521.56 t 值25.5811.49Y=f(X 1,X2)-438714.650.670.95582.01t值-3.0218.475.16Y=f(X 1,X2,X3)-119785.260.41-0.190.97521.53t值0.8519.63.35-3.57Y=f(X 1,X2,X3,X4 )-130566.170

46、.42-0.17-0.090.97751.80t值-0.979.613.57-3.09-1.55Y=f(X 1,X2,X3,X5 )-126905.220.40-0.20.070.97981.55t值-0.8717.853.02-3.470.37结论:回归方程以结论:回归方程以结论:回归方程以结论:回归方程以Y=f(XY=f(X1 1,X X2 2,X X3 3) )为最优:为最优:为最优:为最优:8/8/202428商学院 王中昭4、其它方法:一阶差分,结果不好,、其它方法:一阶差分,结果不好,有些变量的有些变量的T检验不通过。检验不通过。8/8/202429商学院 王中昭5、广义差分、广义

47、差分=1-1.81/2=0.1,计算结果如下:计算结果如下:去掉去掉去掉去掉X X5 5的广义差分为:的广义差分为:的广义差分为:的广义差分为:8/8/202430商学院 王中昭Y Y t t=-2182.65+0.1Y=-2182.65+0.1Yt-1t-1+5.04(X+5.04(X1t1t-0.1X-0.1X1t-11t-1)+ 0.526(X)+ 0.526(X2t2t- -0.1X0.1X2t-12t-1)-0.1952(X)-0.1952(X3t3t-0.1X-0.1X3t-13t-1) )这也是一个较合理的模型,但劳动力这也是一个较合理的模型,但劳动力这也是一个较合理的模型,但劳

48、动力这也是一个较合理的模型,但劳动力X X5 5这个重要解释变这个重要解释变这个重要解释变这个重要解释变量没能列入模型。如何解释?量没能列入模型。如何解释?量没能列入模型。如何解释?量没能列入模型。如何解释?8/8/202431商学院 王中昭你如何解释劳动力这个你如何解释劳动力这个你如何解释劳动力这个你如何解释劳动力这个重要的自变量为什么对重要的自变量为什么对重要的自变量为什么对重要的自变量为什么对粮食生产影响不显著?粮食生产影响不显著?粮食生产影响不显著?粮食生产影响不显著? 根据经验:如果一个根据经验:如果一个根据经验:如果一个根据经验:如果一个变量的值在样本期内没变量的值在样本期内没变量

49、的值在样本期内没变量的值在样本期内没有很大的变化,则它对有很大的变化,则它对有很大的变化,则它对有很大的变化,则它对被解释变量的影响就不被解释变量的影响就不被解释变量的影响就不被解释变量的影响就不能够很好地被度量,从能够很好地被度量,从能够很好地被度量,从能够很好地被度量,从劳动力劳动力劳动力劳动力X X5 5的数据可看出,的数据可看出,的数据可看出,的数据可看出,它对它对它对它对Y Y的影响很难度量,的影响很难度量,的影响很难度量,的影响很难度量,故在进行分析要注意说故在进行分析要注意说故在进行分析要注意说故在进行分析要注意说明。明。明。明。X X5 531645.131645.131685

50、3168530351.530351.53046730467308703087031455.731455.732440.532440.533330.433330.434186.334186.3340373403733258.233258.232690.332690.332334.532334.532260.432260.432434.932434.932626.432626.432911.832911.832797.532797.58/8/202432商学院 王中昭、采用相对数变量:、采用相对数变量:、采用相对数变量:、采用相对数变量:通过采用相对数变量、人均指标、加权平均或作变换通过采用相对数

51、变量、人均指标、加权平均或作变换通过采用相对数变量、人均指标、加权平均或作变换通过采用相对数变量、人均指标、加权平均或作变换等方法把具有共线性的解释变量合并为一个新的解释等方法把具有共线性的解释变量合并为一个新的解释等方法把具有共线性的解释变量合并为一个新的解释等方法把具有共线性的解释变量合并为一个新的解释变量。但要注意新的解释变量应有明确的经济意义。变量。但要注意新的解释变量应有明确的经济意义。变量。但要注意新的解释变量应有明确的经济意义。变量。但要注意新的解释变量应有明确的经济意义。 例例例例: : : : 猪肉需求量猪肉需求量猪肉需求量猪肉需求量Q Q Q Q:Q=Q=Q=Q=1 1 1

52、 1+2 2 2 2Y+Y+Y+Y+3 3 3 3P P P P0 0 0 0+4 4 4 4P P P P1 1 1 1+ 居民收入居民收入居民收入居民收入Y Y Y Y,猪肉平均价,猪肉平均价,猪肉平均价,猪肉平均价P P P P0 0 0 0,替代品价格,替代品价格,替代品价格,替代品价格P P P P1 1 1 1。 改用:改用:改用:改用:Q=Q=Q=Q=1 1 1 1+2 2 2 2Y+Y+Y+Y+3 3 3 3(P(P(P(P0 0 0 0/P/P/P/P1 1 1 1)+)+)+)+ 猪肉的价格除以替代品的价格猪肉的价格除以替代品的价格猪肉的价格除以替代品的价格猪肉的价格除以替

53、代品的价格P P P P0 0 0 0/P/P/P/P1 1 1 1。或如果。或如果。或如果。或如果Q Q Q Q为为为为猪肉的消费支出则可用猪肉的消费支出则可用猪肉的消费支出则可用猪肉的消费支出则可用Q/Q/Q/Q/食品类价格指数、食品类价格指数、食品类价格指数、食品类价格指数、Y/Y/Y/Y/消费物消费物消费物消费物价指数、价指数、价指数、价指数、P P P P0 0 0 0/ / / /食品类价格指数、食品类价格指数、食品类价格指数、食品类价格指数、P P P P1 1 1 1/ / / /食品类价格指数来食品类价格指数来食品类价格指数来食品类价格指数来分别代替分别代替分别代替分别代替Q

54、 Q Q Q、Y Y Y Y、P P P P0 0 0 0、P P P P1 1 1 1。或采用人均指标。或采用人均指标。或采用人均指标。或采用人均指标。3、改变解释变量的形式、改变解释变量的形式8/8/202433商学院 王中昭、采用增量型(或增长率)变量、采用增量型(或增长率)变量 例例:C:Ct t=1 1+2 2Y Yt t+3 3Y Yt-1t-1+t t改用:改用:C Ct t=1 1+2 2Y Yt t+3 3(Y(Yt t)+)+t tYYt t = Y = Yt t-Y-Yt-1t-1或改用增长率模型:或改用增长率模型:8/8/202434商学院 王中昭 多重共线性主要后果是

55、参数估计量的方差多重共线性主要后果是参数估计量的方差太大,为了减小参数估计量的方差可采取太大,为了减小参数估计量的方差可采取如下方法:如下方法: 、主成分分析、主成分分析、岭回归法、岭回归法岭回归是一种有偏估计。岭回归是一种有偏估计。岭回归虽不能消除多重共线性,但它可以岭回归虽不能消除多重共线性,但它可以减少估计量的方差。减少估计量的方差。SPSS软件有进行岭回归的功能。软件有进行岭回归的功能。4、减小参数估计量的方差、减小参数估计量的方差8/8/202435商学院 王中昭 改改变变样样本本( (排排除除由由于于测测量量误误差差、偶偶然因素影响的异常样本然因素影响的异常样本) )。 增增加加样样本本容容量量(注注意意增增加加样样本本可可减减小小估估计计量量的的方方差差,从从而而减减少少多多重重共共线性)线性)。 截面数据与时间序列数据并用。截面数据与时间序列数据并用。5 5、对样本处理、对样本处理8/8/202436商学院 王中昭8/8/202437商学院 王中昭

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号