多重共线性问题的几种解决方法

上传人:平*** 文档编号:14097568 上传时间:2017-10-27 格式:DOC 页数:6 大小:117.98KB
返回 下载 相关 举报
多重共线性问题的几种解决方法_第1页
第1页 / 共6页
多重共线性问题的几种解决方法_第2页
第2页 / 共6页
多重共线性问题的几种解决方法_第3页
第3页 / 共6页
多重共线性问题的几种解决方法_第4页
第4页 / 共6页
多重共线性问题的几种解决方法_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《多重共线性问题的几种解决方法》由会员分享,可在线阅读,更多相关《多重共线性问题的几种解决方法(6页珍藏版)》请在金锄头文库上搜索。

1、多重共线性问题的几种解决方法在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量 X1,X 2,X k中的任何一个都不能是其他解释变量的线性组合。如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果。这里,我们总结了 8 个处理多重共线性问题的可用方法,大家在遇到多重共线性问题时可作参考:1、保留重要解释变量,去掉次要或可替代解释变量2、用相对数变量替代绝对数变量3、差分法4、逐步回归分析 5、主成份分析6、偏最

2、小二乘回归7、岭回归8、增加样本容量这次我们主要研究逐步回归分析方法是如何处理多重共线性问题的。逐步回归分析方法的基本思想是通过相关系数 r 、拟合优度 R2 和标准误差三个方面综合判断一系列回归方程的优劣,从而得到最优回归方程。具体方法分为两步:第一步,先将被解释变量 y 对每个解释变量 作简单回归:对每一个回归方程进行统计检验分析(相关系数 r 、拟合优度 R2 和标准误差),并结合经济理论分析选出最优回归方程,也称为基本回归方程。第二步,将其他解释变量逐一引入到基本回归方程中,建立一系列回归方程,根据每个新加的解释变量的标准差和复相关系数来考察其对每个回归系数的影响,一般根据如下标准进行

3、分类判别:.如果新引进的解释变量使 R2 得到提高,而其他参数回归系数在统计上和经济理论上仍然合理,则认为这个新引入的变量对回归模型是有利的,可以作为解释变量予以保留。.如果新引进的解释变量对 R2 改进不明显,对其他回归系数也没有多大影响,则不必保留在回归模型中。.如果新引进的解释变量不仅改变了 R2 ,而且对其他回归系数的数值或符号具有明显影响,则认为该解释变量为不利变量,引进后会使回归模型出现多重共线性问题。不利变量未必是多余的,如果它可能对被解释变量是不可缺少的,则不能简单舍弃,而是应研究改善模型的形式,寻找更符合实际的模型,重新进行估计。如果通过检验证明回归模型存在明显线性相关的两个

4、解释变量中的其中一个可以被另一个很好地解释,则可略去其中对被解释变量影响较小的那个变量,模型中保留影响较大的那个变量。下边我们通过实例来说明逐步回归分析方法在解决多重共线性问题上的具体应用过程。具体实例例 1 设某地 10 年间有关服装消费、可支配收入、流动资产、服装类物价指数、总物价指数的调查数据如表 1,请建立需求函数模型。表 1 服装消费及相关变量调查数据年份 服装开支可支配收入Y流动资产服装类物价指数 Pc总物价指数 0(百万元) (百万元) (百万元) 1992 年=1001992 年=1001988 8.4 82.9 17.1 92 941989 9.6 88.0 21.3 93

5、961990 10.4 99.9 25.1 96 971991 11.4 105.3 29.0 94 971992 12.2 117.7 34.0 100 1001993 14.2 131.0 40.0 101 1011994 15.8 148.2 44.0 105 1041995 17.9 161.8 49.0 112 1091996 19.3 174.2 51.0 112 1111997 20.8 184.7 53.0 112 111()设对服装的需求函数为用最小二乘法估计得估计模型:模型的检验量得分,R2=0.998,DW=3.383,F=626.4634R2 接近 1,说明该回归模型与

6、原始数据拟合得很好。由得出拒绝零假设,认为服装支出与解释变量间存在显著关系。()求各解释变量的基本相关系数上述基本相关系数表明解释变量间高度相关,也就是存在较严重的多重共线性。()为检验多重共线性的影响,作如下简单回归:各方程下边括号内的数字分别表示的是对应解释变量系数的 t 检验值。观察以上四个方程,根据经济理论和统计检验(t 检验值=41.937 最大,拟合优度也最高),收入是最重要的解释变量,从而得出最优简单回归方程。()将其余变量逐个引入 ,计算结果如下表 2:表 2服装消费模型的估计结果分析:在最优简单回归方程 中引入变量 Pc,使 R2 由 0.9955 提高到0.9957;根据经

7、济理论分析, 正号, 负号是合理的。然而 t 检验 不显著( ),而从经济理论分析, Pc 应该是重要因素。虽然 Y 与 Pc 高度相关,但并不影响收入 Y 回归系数 的显著性和稳定性。依照第 1 条判别标准,Pc 可能是“有利变量”,暂时给予保留。模型中引入变量 L ,R2 由 0.9957 提高到 0.9959, 值略有提高。一方面,虽然 Y 与 L ,Pc 与 L 均高度相关,但是 L 的引入对回归系数 、 的影响不大(其中 的值由 0.1257 变为 0.1387, 值由 -0.0361 变为-0.0345,变化很小);另一方面,根据经济理论的分析,L 与服装支出 C 之间应该是正相关

8、关系,即 的符号应该为正号而非负号,依照第 2 条判别标准,解释变量 L不必保留在模型中。舍去变量 L ,加入变量 P0 ,使 R2 由 0.9957 提高到 0.9980,R2 值改进较大。 、 、 均显著(这三个回归系数的 t 检验值绝对值均大于),从经济意义上看也是合理的(服装支出 C 与 Y,P0 之间呈正相关,而与服装价格 Pc 之间呈负相关关系)。根据判别标准第 1 条,可以认为 Pc、P0 皆为“有利变量”,给予保留。最后再引入变量 L ,此时 R2 0.9980 没有增加(或几乎没有增加),新引入变量对其他三个解释变量的参数系数也没有产生多大影响,可以确定 L 是多余变量,根据判别标准第 2 条,解释变量 L 不必保留在模型中。因此我们得到如下结论: 回归模型为最优模型。通过以上案例的分析,我们从理论和实际问题两方面具体了解了逐步回归分析是如何对多重共线性问题进行处理的。事实上,一般统计软件如 SPSS,在回归模型的窗口中都会提供变量逐步进入的选项,勾选后实际上就是选择了运用逐步回归的思想来构建回归模型。运用 SPSS 软件不需要我们懂得其背后的运行规律,然而作为分析师,了解并理解模型背后的理论知识,将更有助于我们理解模型、解释结论背后的内在含义,从而达到更好地分析问题的目的。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 试题/考题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号