第五章多重共线性(计量经济学,南开大学)

资源描述

《第五章多重共线性(计量经济学,南开大学)》由会员分享，可在线阅读，更多相关《第五章多重共线性(计量经济学,南开大学)（11页珍藏版）》请在金锄头文库上搜索。

2、E(ui)E(Xi） = E(ui Xi) = 0假定7：观测次数必须大于待估计的参数个数。假定8：解释变量X的只要有变异性。即一个样本中，Xi不能完全相同。假定9：模型没有设定误差。假定10：没有完全的多重共线性，即解释变量之间没有完全的线性关系。在现实中，以上假定不一定得到满足。本章讨论某些假定不成立时的估计问题。第五章多重共线性第一节违背古典假定的估计问题第二节多重共线性（multi-collinearity）如果假定10不成立，即在解释变量X1，X2，Xk中，存在线性关系。解释变量间的确定线系关系存在时，存在不全为零的常数这种关系为完全多重共线性，变量间的相关系数为1。实际

3、上更多的情况是，解释变量间有不完全的线性关系：存在不全为零的数：其中vi 为随机项。我们把这种解释变量间存在的完全或不完全的线性关系称为多重共线性。由于经济变量自身的性质，它们之间这种多重共线性或强或弱，普遍存在的。假定10，第三节多重共线性的影响一、完全多重共线性以两个解释变量的回归模型为例，假定回归模型为：如果采用OLS估计，则有：根据最小平方和原则，并求解正规方程组，可得到：如果X2与X3存在完全共线性，即则：因此，存在完全共线性时，不能利用OLS估计参数，参数的方差变为无限大。二、不完全多重共线性假定X2，X3 间存在不完全多重共线性，以离差形式表示为：。其中vi

4、为随机项。则显然，当解释变量X2、X3 之间的相关系数 r23 的绝对值越大，共线性程度就越高，参数估计值的方差就越大，越不准确，且随着相关系数的增大，方差以更大的幅度增加。三、多重共线性的影响（1）参数估计值的方差增大，估计量的精度大大降低。影响预测结果（准确度和置信区间）。（2）参数估计值的标准差增大，使的 t 检验值变小，增大了接受H0，舍弃对因变量有显著影响的变量。（3）尽管t 检验不显著，但是R2仍可能非常高。（4）OLS估计量对观测值的轻微变化相当敏感。一、多重共线性的探查由于多重共线性使一种普遍现象，而多重共线性的程度影响了参数估计结果，因此我们关心的是共线性的程度，而不是共

5、线性是否存在。第三节多重共线性的探查和解决在双边量回归模型中，可以直接对解释变量的相关系数进行显著性检验，以确定线性相关的程度（此时相关系数的平方等于样本决定系数）。而对于多于两个结束变量的回归模型，则不能利用俩俩相关系数来检验。对于有多个变量的回归模型，可以采用辅助回归的方法，分别以k-1个解释变量中的第i个对其他变量进行回归，可得到k-2个回归方程的判定系数：R22，R32，Rk2。假定这些判定系数中Rj2最大且接近1，则变量Xj 与其他解释变量中的一个或多个有较高相关程度，因此回归方程出现高度多重共线性。可以进行F检验确定其显著性：根据第三章的结果，检验R2显著性的F检验值为：

6、可以采用类似的方法检验：选择显著水平，计算F 统计量的值，与F分布表中的临界值进行比较，若F检验值小于临界值，则多重共线性不显著，反之，则多重共线性显著。二、解决多重共线性的方法如果发现监视变量之间存在高度得多重共线性，就必须消除这种多重共线性的影响，保证模型的正确性和估计的有效性。有以下几种解决方法。1、除去不重要的变量把回归模型中引起多重共线性，而对因变量的影响不大的变量。但是变量的剔除可能导致模型的设定偏误。服从t (n-k+1)。给定显著水平，若统计量大于临界值t/2，则说明Xj 与Xi引起回归方程的多重共线性。如果通过前的F检验得到某解释变量Xj 与其它解释变量存在多重共线性

7、，则可以通过t 检验寻找Xj 与哪些变量引起多重共线性。首先计算Xj 与其它每个解释变量的偏相关系数：已知X2 和X3 之间高度共线。根据先验信息，确定3=22，带入模型后可得：例如：C-D生产函数，K与L高度相关。已知规模收益不变，则+=1。生产汉数的双对数模型可变为：可以对这一新回归方程进行估计。2、利用先验信息假定对回归模型：3、变换模型的形式如果作为解释变量的某些经济变量间出现高度相关，而进行回归分析的目的是为了预测，不是研究单个经济变量对因变量的影响时，可以根据实际问题，改变模型模型的形式。4、增加样本容量如果多重共线性是由样本引起，增加样本容量可以减少多重共线性的程

8、度。以二元回归方程为例，根据第二节的结果，参数估计值的方差为：当样本容量增大时，增大，方差将减小，可以提高参数估计的精度。5、横截面数据与时间序列数据并用如果时间序列数据中，解释变量间存在高度相关，可以先使用横截面数据估计出存在高度相关解释变量中的一个或多个，然后再在时间序列数据中剔除这些变量，在消除多重共线性影响下估计因变量与剩余变量间的回归式。例如，为了估计汽车需求的价格弹性和收入弹性，得到销售量、平均价格、消费者收入的时间序列数据。设定回归式：新的回归式中消除了多重共线性的影响。由于在时间序列数据中价格Pt、收入It 一般都具有高度共线的趋势。因此，直接估计上面的回归式将存在问题。由于在同一式点上，价格与收入的相关程度不高，可以先利用截面数据估计出收入弹性，再利用这一估计结果修改原回归式，变为：6、利用时间序列数据的差分或离差进行估计如果时间序列数据中，解释变量间存在高度相关，那么这些变量的差分之间不一定相关。因此利用差分进行回归能降低多重共线性的程度。

展开阅读全文

第五章多重共线性(计量经济学,南开大学)

最新文档