第6章 多重共线性

上传人:汽*** 文档编号:511241126 上传时间:2022-11-19 格式:DOCX 页数:24 大小:491.09KB
返回 下载 相关 举报
第6章 多重共线性_第1页
第1页 / 共24页
第6章 多重共线性_第2页
第2页 / 共24页
第6章 多重共线性_第3页
第3页 / 共24页
第6章 多重共线性_第4页
第4页 / 共24页
第6章 多重共线性_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《第6章 多重共线性》由会员分享,可在线阅读,更多相关《第6章 多重共线性(24页珍藏版)》请在金锄头文库上搜索。

1、第6 章 多重共线性本章专门讨论古典假设中无多重共线性假定被违反的情况,主要内容包括多重共线性的 概念、产生的原因和表现、产生的后果、多重共线性的检验方法及无多重共线性假定违反后 的解决方法。6.1 多重共线性的概念在第三章的多元线性回归模型的建立中,强调了无多重共线性,即假定各解释变量之间 不存在线性关系,或者各解释变量的观测值之间线性无关。计量经济学中的多重共线性是指 模型中各解释变量的线性关系,它不仅包括解释变量之间精确的线性关系,还包括解释变量 之间近似的线性关系,因此多重共线性也就表现为完全多重共线性和近似多重共线性。6.1.1 完全多重共线性从数学意义上去说明多重共线性,就是对于解

2、释变量X、X、X,如果存在不全为2 3 k0的数九九,九,能使得1, 2 k九 + 九 X + 九 X + + 九 X = 0i = 1,2,,n( 6.1.1 )1 2 2 i3 3 i k ki则称解释变量X ,X ,,X之间存在着完全的多重共线性2 3 k用矩阵表示,解释变量的数据矩阵为:1XX-X 12131k1X=1XX- X(6.1.2)2232k 21X2nX-3n- Xkn当矩阵 X 的秩小于 k 时,表明其中至少有一个列向量可以用其余的列向量线性表示, 则说明存在完全多重共线性。6.1.2 不完全的多重共线性在实际经济问题中, 完全的多重共线性并不多见。比较常见的是解释变量X

3、 , X ,,X之间存在不完全的多重共线性。所谓不完全的多重共线性,是指对于解释变 2 3 k量X、X 、X ,存在不全为0的数九九,九,使得2 3 k 1, 2 k九 + 九 X + X X + + X X + u = 0i = 1,2,,n(6.1.3)12 2 i3 3 ik ki i其中,u为随机变量。这表明解释变量X、X、X存在一种近似的线性关系。i23k如果k个解释变量之间不存在完全或不完全的线性关系,则称无多重共线性若用矩 阵表示,这时X为满秩矩阵,即Rank(X)=k。总之,回归模型中解释变量的关系用相关系数表示出来有三种情形: r = 0,解释变量间不存在线性关系,变量间相互

4、正交。这时不需要作多元回归,可以xixj通过Y对X.的多个一元回归来估计每个参数值卩j。 r = 1,解释变量间存在完全共线性。此时模型参数将无法估计。当两变量按同一方式xixj 解释变量之间不存在线性关系,并非不存在非线性关系,当解释变量存在非线性关系时,并不违反无多 重共线性假定。变化时,要区别每个解释变量对被解释变量的影响程度非常困难。 0 r 1,解释变量间存在不同程度的线性关系。随着共线性程度的加强,会对参数估xi x j计值的准确性、稳定性带来不同的影响。因此分析多重共线性的程度是研究的重点问题。6.2 实际经济问题中的多重共线性在实际经济问题中,多重共线性的产生主要是由于经济现象

5、变化的多个影响因素之间存 在一定的相关性。主要表现为以下几种情形:1)经济变量之间具有共同变化趋势在时间序列中,反映经济总体状况的数据指标会出现同样的变化趋势。例如,收入水平、 消费水平和就业率在经济繁荣时期均呈现增长的趋势,而在经济衰退期都出现下降。当这些 变量同时作为模型中的解释变量时就会产生多重共线性。2)滞后变量的引入在经济计量模型中,往往需要引入滞后变量来反映真实的经济状况。例如,消费水平与 人们的当期收入和前期收入密切相关,在建立模型时,就需要引入 X , X , 等多个滞后t -1t - 2变量,它们与X变量之间存在高度相关性,因此导致出现多重共线性。3)截面数据的使用利用截面数

6、据建模时,许多变量变化与发展规模相关,会呈现出共同增长的趋势,例如 资本、劳动力、能源等投入与产出的规模相关,这时容易出现多重共线性。有时如果部分因 素的变化与另一部分因素的变化相关程度较高时,也容易出现共线性。如钢铁产量与原材料 用量、劳动力人数、厂房面积、生产投入资金建立回归模型,发现回归效果较差,原因是生 产投入资金的影响已经通过原材料和劳动力两个因素体现出来,三者之间存在较严重的多重 共线性。4)样本资料自身的限制抽样选取的样本只是总体解释变量取值中的一个有限范围,会使得变量的变异不大;由 于总体受限,多个解释变量的样本数据之间存在相关关系,也会造成样本的多重共线性;另 外,客观上完全

7、符合理论模型所要求的样本数据较难收集,也会使得特定样本存在某种程度 的共线性。这一点在时间序列数据模型中表现更加明显。6.3 多重共线性问题的后果6.3.1 完全多重共线性下产生的后果1)参数的估计值不存在完全共线性时,X矩阵的秩小于k,此时X X | = 0,正规方程组的解不惟一,(X X )-1不存在,回归参数的最小二乘估计表达式不成立。例如,在两个解释变量的回归模型Y =卩+卩X +卩X + u中,假定X与X之间存在完全多重共线性,即X = XX ,i 1 2 2i 3 3i i2i3i2i3i久是一个非零常数,则有:P2P36工 yx 血 x 2)一(工 yx_)(工3ii(2 工 X

8、 2 )( X 2 )九 2 (工 x X3i3i3i 3i(工y x斤2工X 2) 6工y X斤工X 2 ) i_- (工X 2X X373t(6.3.1)XX3i3i3i 3iy X 斤2 工 x 2 )一6 工 y x t 3131、” 2(_.3i3i62 工 X2 )(E X2 )3i-3f(6.3.2)这说明当X二九X时,参数的估计值是不确定的。2 i3i例 6.1:用商品价格和每周收入作某一商品需求量的回归分析表 6.1Y(需求量)X2(价格)X3 (每周收入)X4 (每周收益)491298297.5452296294.9443294293.5394292292.83852902

9、90.2376288289.7347286285.8338284284.6309282281.12910280278.8点击procmake equation,弹出如图6.1所示的对话框2 X ,1i由此可见无法对Y进行回归拟合,分析后发现这是因为= 300 R 2 C r 2 )= 1,也就是说收入变量与价格变量完全线性相关,二者存在完全多重共线性。2)参数估计值的方差无限大对两个解释变量的回归模型进行OLS估计,其参数的方差为Var-C ov( P )= b 2( X X) -1,在完全共线性情况下,X = X X2 i3i则有A工x 2Var (卩)=3b 26.3.3)6.3.4)2(

10、乙 X 2)(乙 x 2)-(乙 x X ) 22323工X 2 J 2工X 2)匕X 2)-(九工b 2 =3 b 2 = gx x )2033同理aX2 工 X 2Var (卩)=3b 23(X2 乙 x 2)(乙 x 2) - (X 乙 x x )23333这表明,当解释变量之间存在完全的共线性时,参数估计值的方差将变成无穷大。这直 接导致模型总体参数的置信区间变大,使回归方程的可决系数R 2很高,但对各个参数单独 的 t 检验却可能不显著,甚至可能使估计的回归系数符号相反,得出完全错误的结论,从 而使普通最小二乘估计量的精确度降低,使变量的显著性检验失败。6.3.2 不完全多重共线性下

11、产生的后果在实际经济问题中,解释变量之间往往存在不完全共线性,在这种情况下,通过回归可以得到参数的估计值。在例6.1中,作X2,X4对被解释变量Y的回归方程,结果如图6.2 所示: Equation: 1TBTITLEDTorkfile:例一 :ITuti tied|View Proc Object Print Name Freeze Estimate Forecast Stats ResideDependent Variable: Y Method: Least Squares Date: 03/23/09 Time: 12:03 Sample: 1/01/2008 3/04/2003 In

12、cluded obseivations: 10VariableCoefficientStd. Errort-StatisticProb.X2-2.7974750.812185-3.4443030.0108X4-0.3190000.400306-0.7970090.451 6C145.36501 20.06221.2107470.2653R-squared0.977752Mean dependent var37.80000Adjusted R-squared0.971396S.D. dependent var6.61311 SS.E. of regression1.113463Akaike in

13、fo criterion3.30511 3Sum squared resid8.75671 7Schwarz criterion3.395839Log likelihood-13.52557Hannan-Quinn criter.3.205533F-statistic153.8192Durbin-Wats on stat2.560899Prob(F-statistic)0.000002图 6.2从理论上说,在接近共线性的情形下仍能进行最小二乘估计,而且该估计量是无偏的能满足最小二乘估计量的最小方差性,但是实际上,共线性的存在对计量经济分析可能会产生一系列的影响。1)参数估计值的方差增大以两个解

14、释变量的回归模型为例,x2i=九X + V,其中,九H 0 , V是满足工3 i i i由此可得出OLS法估计的回归系数:假设 X 与 X 存在不完全的共线性, 即 23X V = 0的随机误差项。2 i i.(工y X汎2工0i3r3工v 2 )一6工y x +工y v斤工X 2 )工v 2 )匕X 2 )一九2 (工X 2iX 2 +3i久2工X 2 +3 ii3 i3 i因此在X与X近似共线性时,6还是可以估计的。但是,如果X与X共线程度越23323v会充分地小,以至于非常接近于零,此时6会愈加趋于不确定。对于62也可推出类i32似的表达式,并得到类似的结论。(6.3.5)高,在 X 与 X 为不完全的共线性时,2X 与 X 的相关系数的平方用离差形式可表示为 23可以证明得到r223(工 XX )223X223Var(0 )=2工x27I;3;c 2(Y X2)(Y X2) 一 (Y X X )22323C 2Y X 2 (1 一 r 2 )

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号