多重共线性的解决

上传人:工**** 文档编号:565038912 上传时间:2023-10-22 格式:DOCX 页数:16 大小:61.73KB
返回 下载 相关 举报
多重共线性的解决_第1页
第1页 / 共16页
多重共线性的解决_第2页
第2页 / 共16页
多重共线性的解决_第3页
第3页 / 共16页
多重共线性的解决_第4页
第4页 / 共16页
多重共线性的解决_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《多重共线性的解决》由会员分享,可在线阅读,更多相关《多重共线性的解决(16页珍藏版)》请在金锄头文库上搜索。

1、第七章 多重共线性教学目的及要求:1、重点理解多重共线性在经济现象中的表现及产生的原因和后果2、掌握检验和处理多重共线性问题的方法3、学会灵活运用Eviews软件解决多重共线性的实际问题。第一节 多重共线性的产生及后果一、多重共线性的含义1、含义 在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系, 也就是说,解释变量, x2,,Xk中的任何一个都不能是其他解释变量的线性组合。如果违背这 一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中 存在多重共线性。多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重

2、后果。2、类型 多重共线性包含完全多重共线性和不完全多重共线性两种类型。(1)完全多重共线性 完全多重共线性是指线性回归模型中至少有一个解释变量可以被其他解释变量线性表示,存在 严格的线性关系。如对于多元线性回归模型Y 二 B +P X +P X + 卄 X +卩(7-1)i 0 1 1i2 2 ik ki i存在不全为零的数九,九,,九,使得下式成立:1 2 k九X + 九 X + +九 X 二 01 1i2 2 ik ki( 7-2)则可以说解释变量X ,X,,X之间存在完全的线性相关关系,即存在完全多重共线性。1 2 k从矩阵形式来看,就是|XX = 0 ,即rank(X) k -1,观

3、测值矩阵是降秩的,表明在向量X中至少有一个列向量可以由其他列向量线性表示。(2)不完全多重共线性不完全多重共线性是指线性回归模型中解释变量间存在不严格的线性关系,即近似线性关系。如对于多元线性回归模型(7-1)存在不全为零的数九,九,,九,使得下式成立:1 2 k九X + 九 X + +九 X + u 二 01 1i 2 2 ik ki i( 7-3)其中u 为随机误差项,则可以说解释变量X ,X,,X之间存在不完全多重共线性。随机误差i 1 2 k项表明上述线性关系是一种近似的关系式,大体上反映了解释变量间的相关程度。完全多重共线性与完全非线性都是极端情况,一般说来,统计数据中多个解释变量之

4、间多少都存在一定程度的相关性,对多重共线性程度强弱的判断和解决方法是本章讨论的重点。二、多重共线性产生的原因多重共线性在经济现象中具有普遍性,其产生的原因很多,一般较常见的有以下几种情况。(一)经济变量间具有相同方向的变化趋势在同一经济发展阶段,一些因素的变化往往同时影响若干经济变量向相同方向变化,从而引起 多重共线性。如在经济上升时期,投资、收入、消费、储蓄等经济指标都趋向增长,这些经济变量 在引入同一线性回归模型并作为解释变量时,往往存在较严重的多重共线性。(二)经济变量间存在较密切关系由于组成经济系统的各要素之间是相互影响相互制约的,因而在数量关系上也会存在一定联系 如耕地面积与施肥量都

5、会对粮食总产量有一定影响,同时,二者本身存在密切关系。(三)采用滞后变量作为解释变量较易产生多重共线性一般滞后变量与当期变量在经济意义上关联度比较密切,往往会产生多重共线性。如在研究消 费规律时,解释变量因素不但要考虑当期收入,还要考虑以往各期收入,而当期收入与滞后收入间 存在多重共线性的可能很大。(四)数据收集范围过窄,有时会造成变量间存在多重共线性问题。三、多重共线性产生的后果由前述可知,多重共线性分完全多重共线性和不完全多重共线性两种情况,两种情况都会对模型进行最小二乘估计都会产生严重后果。一)完全多重共线性产生的后果以二元线性回归模型为例,7-4)以离差形式表示,假设其中yi _ Y.

6、 - Y,xh. _ x厂耳,Y _P +P X +P X +i011iu22iix _ X - X,2i2i2X1i二九X ,常2i数九乂 o,贝y,x _ x x1i2il工x 2工x0 _11i2iy 一九工X2工x y力 i2i2.ii乙X2 )2i,P 的最小二乘估计量为y -工x x工x iA)乙x 2乙x 2 一匕x x尢 1i2i( _ 2L2九2(乙X2 )2 一九2(2i7-5)7-6)可见参数估计值0和P无法确定。 12再考察参数估计量的方差,由前面章节可知:C )工X2var p 召21乙X2 乙X2 一匕X X 2 u1i 2i1i 2i7-7)将X _x X代入上式

7、,则1i2ivar(卩C 2 工 X2)_u2U1尢2(乙 X2 )2 一 尢2(乙 X2 )22i2i7-8)说明此种情况下片方差为无穷大。同理可以证明匚的方差在完全共线性下也为无穷大。以上分析表明,在完全多重共线性条件下,普通最小二乘法估计的参数值不能确定,并且估计值的方差为无穷大。二)不完全多重共线性产生的后果假设上述二元线性回归模型中解释变量X“与x2i的关系为X1i九 X + v2ii7-9)其中v为随机项,满足E(v ) 0,EX v 0,代入念估计表达得:ii2i i1B 上y0x2i+Vi)呛x2(工乂?/)%2,(尬2,+卩1氐(入 x2i+ vi)2呛 x2i)七 x2ix

8、2i+ vi)27-10)由于工v2i丰0 因而叫是可确定估计的但是其数值依赖vi的数值,而 v 的数值随样本的变 i化有较大变化,所以片估计值是很不稳定的。同理可以证明匚也是可估计的且数值具有不稳定性。考察估计量的方差:由(7-1)式可知知是化、X2i的相关系数因此(E x x )2九2 一号皿 -E x2 Exr2-432 r r1i2i11 227-11)参数估计量的方差可表达为:b 2 E X2u1i1 - r 2127-12)其中r为X和X之间的相关系数,从(7-12)式可见,I r I的值越大,则共线程度越高,估计121i2i12量方差var ( 2L大,直至无穷。综上所述,线性回

9、归模型解释变量间存在多重共线性可能产生如下后果:增大最小二乘估计量 的方差;参数估计值不稳定,对样本变化敏感;检验可靠性降低,产生弃真错误。由于参数估计量 方差增大,在进行显著性检验时, t 检验值将会变小,可能使某些本该参数显著的检验结果变得不显 著,从而将重要变量舍弃。第二节 多重共线性的检验多重共线性是较为普通存在的现象,从上节分析可知,较高程度的多重共线性会对最小二乘估 计产生严重后果,因此,在运用最小二乘法进行多元线性回归时,不但要检验解释变量间是否存在 多重共线性,还要检验多重共线性的严重程度。一、不显著系数法情况 1、R2 很大, t 小不显著系数法是利用多元线性回归模型的拟合结

10、果进行检验。如果拟合优度R 2的值很大(一般 来说在以上),然而模型中的全部或部分参数值估计值经检验却不显著,那么解释变量间有可能存在 较严重的多重共线性。情况 2、理论性强,检验值弱 如果从经济理论或常识来看某个解释变量对被解释变量有重要影响,但是从线性回归模型的拟 合结果来看,该解释变量的参数估计值经检验却不显著,那么可能是解释变量间存在多重共线性所 导致的。情况 3、新引入变量后,方差增大 在多元线性回归模型中新引入一个变量后,发现模型中原有参数估计值的方差明显增大,则说 明解释变量间可能存在多重共线性。二、拟合优度R 2检验j对多元线性回归模型中各个解释变量相互建立回归方程,分别求出各

11、回归方程的拟和优度,如果其中最大的一个接近1,F.显著大于临界值,该变量可以被其他变量线性解释,则其所对应的解 i释变量与其余解释变量间存在多重共线性。如设某多元线性回归模型中原有k个解释变量X,X,X,将每个解释变量对其他解释变量12k进行回归,得到k个回归方程:X 二 f (X ,X,X )1 2 3kX 二 f (X ,X,X )2 1 3kX 二 f (X,X,,X )k1 2k-1分别求出上述各个方程的拟合优度R2,R2,,R2 ,2K如果其中最大的一个R 2接近于1,则它i所对应的解释变量Xi与其余解释变量间存在多重共线性。三、相关矩阵法考察多元线性回归模型Y 二B +P X +

12、+P X011k k(7-13)其解释变量之间的相关系数矩阵为:rrr_ 1rr11121k121krr rr1rR =21222 k=21.2 krr rrr 1k1k2kk _k1k27-14)因为r二r ,所以上面相关阵为对称阵,r二1,只需考察主对角线元素上方(或下方)某 ij jijj个元素绝对值是否很大(一般在以上),就可以判断两个解释变量间是否存在多重共线性。结论:另外需要特别注意的是,如果相关系数很大,则一定存在多重共线性,如果相关系数很小,不 一定没有多重共线性。四、Friscl综合分析法1、方法及分析标准Frisch 综合分析法也叫逐步分析估计法,其基本思想是先将被解释变量

13、对每个解释变量作简单回归方程,称为基本回归方程。再对每一个基本回归方程进行统计检验,并根据经济理论分析选出 最优基本方程,然后再将其他解释变量逐一引入,建立一系列回归方程,根据每个新加的解释变量 的标准差和复相关系数来考察其对每个回归系数的影响,一般根据如下标准进行分类判别:1 如果新引进的解释变量使R2得到提高,而其他参数回归系数在统计上和经济理论上仍然合 理,则认为这个新引入的变量对回归模型是有利的,可以作为解释变量予以保留。2 如果新引进的解释变量对R 2改进不明显,对其他回归系数也没有多大影响,则不必保留在 回归模型中。3 .如果新引进的解释变量不仅改变了R2,而且对其他回归系数的数值

14、或符号具有明显影响, 则可认为引进新变量后,回归模型解释变量间存在严重多重共线性。这个新引进的变量如果从理论 上分析是十分重要的,则不能简单舍弃,而是应研究改善模型的形式,寻找更符合实际的模型,重 新进行估计。如果通过检验证明存在明显线性相关的两个解释变量中的一个可以被另一个解释,则 可略去其中对被解释变量影响较小的那个变量,模型中保留影响较大的那个变量。2、具体实例例7-1 设某地 10 年间有关服装消费、可支配收入、流动资产、服装类物价指数、总物价指数 的调查数据如表 7-1,请建立需求函数模型。表 7-1 服装消费及相关变量调查数据年份服装开支C(百万兀)可支配收入Y(百万兀)流动资产L(百万兀)服装类物价指数Pc1992 年=100总物价指数P。1992 年=1001988929419899396199096971991949719921001001993

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号