大学生课件_数学统计学：回归模型的扩展课件：第三节多重共线性

资源描述

《大学生课件_数学统计学：回归模型的扩展课件：第三节多重共线性》由会员分享，可在线阅读，更多相关《大学生课件_数学统计学：回归模型的扩展课件：第三节多重共线性（42页珍藏版）》请在金锄头文库上搜索。

1、第三节多重共线性 Multi Collinearity 3 3多重共线性一多重共线性的概念对于模型Yi 0 1X1i 2X2i kXki ii 1 2 n其基本假设之一是解释变量是互相独立的如果某两个或多个解释变量之间出现了相关性则称为多重共线性 Multicollinearity 如果存在c1X1i c2X2i ckXki 0i 1 2 n其中 ci不全为0 则称为解释变量间存在完全共线性 perfectmulticollinearity 如果存在c1X1i c2X2i ckXki vi 0i 1 2 n其中ci不全为0 vi为随机误差项则称为近似共线性 approximatem

2、ulticollinearity 或交互相关 intercorrelated 在矩阵表示的线性回归模型Y X 中完全共线性指秩 X k 1 即中至少有一列向量可由其他列向量不包括第一列线性表出如 X2 X1 则X2对Y的作用可由X1代替注意完全共线性的情况并不多见一般出现的是在一定程度上的共线性即近似共线性二实际经济问题中的多重共线性一般地产生多重共线性的主要原因有以下三个方面 1 经济变量的内在联系经济系统中各要素之间只要是相互依存相互制约的在数量关系上必然存在一定的联系因此多重共线性不可避免只是影响程度有所不同而已 2 经济变量变化趋势的共向性有

3、些经济变量虽无明显的内在联系但在考察的样本期内其变化方向一致如时间序列样本经济繁荣时期各基本经济变量收入消费投资价格都趋于增长衰退时期又同时趋于下降横截面数据生产函数中资本投入与劳动力投入往往出现高度相关情况大企业二者都大小企业都小 3 滞后变量的引入在经济计量模型中往往需要引入滞后经济变量来反映真实的经济关系例如消费 f 当期收入前期收入显然两期收入间有较强的线性相关性含有滞后变量的模型一般都有多重共线性 4 样本资料的限制由于完全符合理论模型所要求的样本数据较难收集特定样本可能存在某种程度的多重共线性一般经验时间序列数据样本简单线

4、性模型往往存在多重共线性截面数据样本问题不那么严重但多重共线性仍然是存在的二多重共线性的影响 1 完全共线性下参数估计量不存在如果存在完全共线性则 X X 1不存在无法得到参数的估计量的OLS估计量为例对离差形式的二元回归模型如果两个解释变量完全相关如x2 x1 则这时只能确定综合参数 1 2的估计值 2 增大OLS估计的方差近似共线性下OLS估计量非有效近似共线性下可以得到OLS参数估计量但参数估计量方差的表达式为由于 X X 0 引起 X X 1主对角线元素较大使参数估计值的方差增大 OLS参数估计量非有效仍以二元线性模型为例称VIF为方差膨

5、胀因子 VarianceInflatingFactor 可见多重共线性使参数估计值的方差增大1 当完全不共线时当近似共线时当完全共线时 3 难以区分每个解释变量的单独影响参数估计量经济含义不合理如果模型中两个解释变量具有线性相关性例如X2 X1 这时 X1和X2前的参数 1 2并不反映各自与被解释变量之间的结构关系而是反映它们对被解释变量的共同影响 1 2已经失去了应有的经济含义于是经常表现出似乎反常的现象例如 1本来应该是正的结果恰是负的 4 变量的显著性 t 检验的可靠性降低以至失去意义存在多重共线性时参数估计值的方差与标准差变大容易使通过样本计算的t值小于临界

6、值误导作出参数为0的推断可能将重要的解释变量排除在模型之外 5 模型的稳定性降低预测功能失效当模型存在多重共线性时即使数据有微小的变化也会导致系数估计值发生明显的变化即会使得模型的稳定性降低从同一个总体中抽取不同的样本得到的估计值虽不会完全相同但也不应有显著差异这既是模型的稳定性而变大的方差容易使区间预测的区间变大使预测失去意义注意除非是完全共线性多重共线性并不意味着任何基本假设的违背 G M假设中对有无共线性无特别要求因此即使出现较高程度的多重共线性 OLS估计量仍具有线性性等良好的统计性质问题在于即使OLS法仍是最好的估计方法它却不是完美的

7、尤其是在统计推断上无法给出真正有用的信息多重共线性检验的任务是 1 检验多重共线性是否存在 2 估计多重共线性的范围即判断哪些变量之间存在共线性多重共线性表现为解释变量之间具有相关关系所以用于多重共线性的检验方法主要是统计方法如判定系数检验法逐步回归检验法等三多重共线性的检验 1 相关系数检验 1 对两个解释变量的模型采用简单相关系数法求出X1与X2的简单相关系数r 若 r 接近1 则说明两变量存在较强的多重共线性 2 对多个解释变量的模型采用综合统计检验法若在OLS法下 R2与F值较大但t检验值较小说明各解释变量对Y的联合线性作用显著但各解释变量间存在共线性而使

8、得它们对Y的独立作用不能分辨故t检验不显著命令方式 COR解释变量名菜单方式将所有解释变量设置成一组在数组窗点击View Correlations 2 辅助回归模型检验相关系数检验只能判断解释变量之间的如果存在多重共线性需进一步确定究竟由哪些变量引起 1 辅助回归模型的判定系数检验法使模型中每一个解释变量分别以其余解释变量为解释变量进行回归并计算相应的拟合优度如果某一种辅助回归模型的判定系数较大说明与其他X间存在共线性对辅助回归模型的检验不仅能检验模型是否存在多重共线性而且可以得到多重共线性的具体形式如再结合偏相关系数检验还可以判断是那些解释变量引起了多重

9、共线性这有助于分析如何消除多重共线性的影响在模型中排除某一个解释变量估计模型如果拟合优度与包含时十分接近则说明与其它解释变量之间存在共线性另一等价的检验是 3 方差膨胀因子检验对多元线性回归模型有 4 特征值检验考察解释变量的样本数据矩阵线性回归模型Y X 存在完全共线性时有 rank X k 1 当模型存在严重的共线性时有因此可以利用特征值中是否有近似等于零来检验模型的共线性逐步回归法也可以用此法解决共线性问题见P114 以Y为被解释变量逐个引入解释变量构成回归模型进行模型估计根据拟合优度的变化决定新引入的变量是否独立如果拟合优度变化显著则说明新引入

10、的变量是一个独立解释变量如果拟合优度变化很不显著则说明新引入的变量与其它变量之间存在共线性关系找出引起多重共线性的解释变量将它排除出去注意这时剩余解释变量参数的经济含义和数值都可能发生了变化如果模型被检验证明存在多重共线性则需要发展新的方法估计模型最常用的方法有三类四多重共线性的解决方法 1 第一类方法排除引起共线性的变量剔除变量的方法有直接法和间接法 P111 1 直接剔除次要或可替代的变量根据理论经验相关系数相关图等 2 间接剔除重要的解释变量 P111 b 变换模型的形式 a 利用附加信息 c 综合使用时间序列数据和截面数据 3 逐步回归 P114 a

11、先选取相关性最强的解释变量建立一元回归模型 b 在一元模型中分别加入第二个变量共建立k 1个二元模型从中选取一个最优的 c 以二元模型为基础引入第三各变量如此下去直至无法引入新的变量为止 2 第二类方法用差分法削弱共线性时间序列数据线性模型将原模型变换为差分模型 Yi 1 X1i 2 X2i k Xki i可以有效地消除原模型中的多重共线性一般讲增量之间的线性关系远比总量之间的线性关系弱得多例如由表中的比值可以直观地看到增量的线性关系弱于总量之间的线性关系进一步分析 Y与C之间的判定系数为0 9988 Y与 C之间的判定系数为0 7567 近似例题5服装需求

12、函数 P114 3 第三类方法减小参数估计量的方差多重共线性的主要后果是参数估计量具有较大的方差所以采取适当方法减小参数估计量的方差虽然没有消除模型中的多重共线性但确能消除多重共线性造成的后果例如增加样本容量可使参数估计量的方差减小岭回归法 RidgeRegression 70年代发展的岭回归法以引入偏误为代价减小参数估计量的方差受到人们的重视具体方法是引入使参数估计量为六案例中国粮食生产函数根据理论和经验分析影响粮食生产 Y 的主要因素有农业化肥施用量 X1 粮食播种面积 X2 成灾面积 X3 农业机械总动力 X4 农业劳动力 X5 已知中国粮食生产的

13、相关数据建立中国粮食生产函数 Y 0 1X1 2X2 3X3 4X4 4X5 1 用OLS法估计上述模型 R2接近于1 给定 5 得F临界值F0 05 5 12 3 11F 638 4 15 19 故认上述粮食生产的总体线性关系显著成立但X4 X5的参数未通过t检验且符号不正确故解释变量间可能存在多重共线性 0 91 8 39 3 32 2 81 1 45 0 14 2 检验简单相关系数发现 X1与X4间存在高度相关性列出X1 X2 X3 X4 X5的相关系数矩阵 3 找出最简单的回归形式可见应选第1个式子为初始的回归模型分别作Y与X1 X2 X4 X5间的回归 25 58 11 49 R2 0 8919F 132 1DW 1 56 0 49 1 14 R2 0 075F 1 30DW 0 12 17 45 6 68 R2 0 7527F 48 7DW 1 11 1 04 2 66 R2 0 3064F 7 07DW 0 36 4 逐步回归将其他解释变量分别导入上述初始回归模型寻找最佳回归方程回归方程以Y f X1 X2 X3 为最优 5 结论讨论请参见李子奈 p79 粮食生产模型其使用数据是83 95年的

展开阅读全文

大学生课件_数学统计学：回归模型的扩展课件：第三节 多重共线性

大学生课件_数学统计学：回归模型的扩展课件：第三节多重共线性