《计量经济学》第4章.多重共线性

上传人:平*** 文档编号:46180072 上传时间:2018-06-23 格式:PPT 页数:45 大小:1.79MB
返回 下载 相关 举报
《计量经济学》第4章.多重共线性_第1页
第1页 / 共45页
《计量经济学》第4章.多重共线性_第2页
第2页 / 共45页
《计量经济学》第4章.多重共线性_第3页
第3页 / 共45页
《计量经济学》第4章.多重共线性_第4页
第4页 / 共45页
《计量经济学》第4章.多重共线性_第5页
第5页 / 共45页
点击查看更多>>
资源描述

《《计量经济学》第4章.多重共线性》由会员分享,可在线阅读,更多相关《《计量经济学》第4章.多重共线性(45页珍藏版)》请在金锄头文库上搜索。

1、 第四章 多重共线性Multi-Collinearity计量经济学引子: 国内生产总值增加会减少财政收入吗?为了分析各主要因素对国家财政收入的影响,建立 财政收入(亿元) (CZSR)为被解释变量,财政支出(亿 元)(CZZC)、国内生产总值(亿元)(GDP)、税收总 额(亿元)(SSZE)等为解释变量的计量模型。数据样本 时期:1978年-2011年的统计数据。 设定的理论模型为:采用普通最小二乘法得到以下估计结果财政收入模型的EViews估计结果VariableCoefficient Std. Error t-Statistic Prob. 截距119.0786107.12361.1116

2、000.2751财政支出0.1223550.0488462.5049100.0179国内生产总值产总值-0.0341040.005068-6.7291010.0000税收总额1.1811570.06967616.952040.0000R-squared0.999791 Mean dependent var18185.17Adjusted R-squared0.999770 S.D. dependent var26129.67S.E. of regression395.9401 Akaike info criterion14.91053Sum squared resid4703056. Schw

3、arz criterion15.09011Log likelihood-249.4791 Hannan-Quinn criter.14.97177F-statistic47897.29 Durbin-Watson stat1.025140Prob(F-statistic)0.000000可决系数为0.99979 ,校正的可决系数为0.99977, 模型拟合很好。模型对财政收入的解释程度高达99.9% 。F统计量为47897.29,说明0.05水平下回归方程整 体上很显著。 t 检验结果表明,各个解释变量对财政收入的影 响均显著,但是国内生产总值对财政收入的回归系数 的符号为负,即经济增长反而会

4、使财政收入减少。这 显然与理论分析和实践经验不相符。为什么会出现这 样的异常结果?如果模型设定和数据真实性没问题, 问题会出在哪里呢?模型估计与检验结果分析第四章 多重共线性本章讨论五个问题:什么是多重共线性多重共线性的经济背景多重共线性产生的后果多重共线性的检验多重共线性的补救措施一、多重共线性的含义或者说, 时,表明在数据矩阵 中,至少有一个列向量可以用其余的列向量线性表示,则说明存在完全的多重共线性。对于解释变量 ,如果存在不全为0的 数 ,使得则称解释变量 之间存在着完全的多 重共线性完全的多重共线性不完全的多重共线性 若解释变量 ,存在不全为0的数,使得为随机变量其中,具有近似的多重

5、共线性则称,解释变量间毫无线性关系,变量间相 互正交。这时已不需要作多元回归,每个参数j都可 以通过Y 对 Xj 的一元回归来估计。回归模型中解释变量的关系 可能表现为三种情形: (1),解释变量间完全共线性。此时模型 参数将无法确定。,解释变量间存在一定程度的线性 关系。实际中常遇到的情形。(2)(3) 二、产生多重共线性的背景 多重共线性产生的经济背景主要有几种情形:1.经济变量之间具有共同变化趋势。 时间序列数据:经济繁荣时期,各基本经济变量(收入、消 费、投资、价格)都趋于增长;衰退时期,又同时趋于下降横截面数据:变量变化与发展规模有关,例如在生产函数中 ,资本投入与劳动力投入往往出现

6、高度相关情况,大企业二者 都大,小企业都小2.模型中包含滞后变量。 例如,消费=f(当期收入, 前期收入) 3.样本数据自身的原因。 抽样取值有限三、 多重共线性产生的后果如果存在完全共线性,则(XX)-1不存在,无法得 到唯一的参数估计量。1、完全共线性下参数估计量无意义OLS估计量为 :X1和X2前的参数1、2并不反映各自与被解释变 量之间的结构关系,而是反映它们对被解释变量 的共同影响。1、2已经失去了应有的经济含义 ,于是经常表现出似乎反常的现象:例如1本来 应该是正的,结果恰是负的。这时,实际只能确定综合参数1+2的估计值以离差形式的二元回归模型为例如果两个解释变量完全相关,如x2=

7、 x1,则m+=2211xxy近似共线性下,可以得到OLS参数估计量,但参数估计量方差的表达式为由于|XX|0,引起(XX) -1主对角线元素较大 ,使参数估计值的方差增大,OLS参数估计量非 有效,亦会使变量的显著性检验和预测检验失去 意义2、不完全共线性下估计量方差偏大四、多重共线性的检验本节基本内容: 简单相关系数检验法 方差扩大(膨胀)因子法 直观判断法 逐步回归法两个问题(1)是否存在(2)哪些变量存在?1、简单相关系数检验法判断规则:一般而言,如果每两个解释变量的简单相关系数(零阶相关系数)比较高,例如大于0.8,则可认为存在着较严重的多重共线性。计算解释变量之间的相关系数或相关矩

8、阵注意:较高的简单相关系数只是多重共线性存在的充分条件 ,而不是必要条件2、方差扩大(膨胀)因子法 统计统计 上可以证证明,的方差可表示为为(Variance Inflation Factor),即其中的是变变量的方差扩大因子其中 是Xj关于其余解释变释变 量的辅辅助回归归 的可决系数经验规则方差膨胀因子越大,表明解释变量之间的多重共性越严重。反过来,方差膨胀因子越接近于1,多重共线性越弱。经验表明,方差膨胀因子10时,说明解释变量与其余解释变量之间有严重的多重共线性,且这种多重共线性可能会过度地影响最小二乘估计。3、直观判断法1. 当增加或剔除一个解释变量,或者改变一个观测值时,回归参数的估

9、计值发生较大变化2. 一些重要的解释变量的回归系数的标准误差较大,在回归方程中没有通过显著性检验时3. 有些解释变量的回归系数所带正负号与定性分析结果违背时4. 模型的可决系数较高,F检验显著,回归系数的方差较大,t值较小,即在统计上均不显著。根据经验,通常以下情况的出现可能是由于存在多重共线性4、逐步回归检测法逐步回归的基本思想将变量逐个的引入模型,每引入一个解释变量后,都要进行检验,并对已经选入的解释变量逐个 进行t 检验,当原来引入的解释变量由于后面解释变量的引入而变得不再显著时,则将其剔除。以确保每 次引入新的变量之前回归方程中只包含显著的变量。在逐步回归中,高度相关的解释变量,在引入

10、时会被剔除。因而也是一种检测多重共线性的有效方 法。五、 多重共线性的补救措施本节基本内容:修正多重共线性的经验方法逐步回归法1、修正多重共线性的经验方法(1). 剔除变量法把方差扩大因子最大者所对应的自变量首先剔除再重新建立回归方程,直至回归方程中不再存在严重的多重共线性。注意: 若剔除了重要变量,可能引起模型的设定误差。(2). 增大样本容量如果样本容量增加,会减小回归参数的方差,标准误差也同样会减小。因此尽可能地收集足够多的样本数据可以改进模型参数的估计。问题:增加样本数据在实际计量分析中常面临许多困难。(3). 变换模型形式(一般适用于时间序列数据)一般而言,差分后变量之间的相关性要比

11、差分前弱得多,所以差分后的模型可能降低出现共线性的可能性,此时可直接估计差分方程。问题:差分会丢失一些信息,差分模型的误差项可能存在序列相关,可能会违背经典线性回归模型的相关假设,在具体运用时要慎重。(4). 利用非样本先验信息通过经济理论分析能够得到某些参数之间的关系,可以将这种关系作为约束条件,将此约束条件和样本信息结合起来进行约束最小二乘估计。(5). 横截面数据与时序数据并用首先利用横截面数据估计出部分参数,再利用时序数据估计出另外的部分参数,最后得到整个方程参数的估计。 注意:这里包含着假设,即参数的横截面估计和从纯粹时间序列分析中得到的估计是一样的。 (6). 变量变换变量变换的主

12、要方法:(1)计算相对指标 (2)将名义数据转换为实际数据 (3)将小类指标合并成大类指标 (4)对数变换变量数据的变换有时可得到较好的结果,但无法保证一定可以得到很好的结果。2、逐步回归法(1)用被解释变量对每一个所考虑的解释变量做简单回归。(2)以对被解释变量贡献最大的解释变量所对应的回归方程为基础,按对被解释变量贡献大小的顺序逐个引入其余的解释变量。(a)若新变量的引入改进了 和 检验,且回归参数的t 检验在统计上也是显著的,则在模型中保留该变量。(b)若新变量的引入未能改进 和 检验,且对其他回归参数估计值的t 检验也未带来什么影响,则认为该变量是多余变量。(c)若新变量的引入未能改进

13、 和 检验,且显著地影响了其他回归参数估计值的数值或符号,同时本身的回归参数也通不过t 检验,说明出现了严重的多重共线性。(d)已被引入回归方程的变量在引入新变量后,也可能失去重要性而被剔除。六、案例分析 一、研究的目的要求 提出研究的问题为了规划中国未来国内旅游产业 的发展,需要定量地分析影响中国国内旅游市场发展 的主要因素。 二、模型设定及其估计 影响因素分析与确定影响因素主要有国内旅游 人数 ,城镇居民人均旅游支出 ,农村居民人均 旅游支出 ,并以铁路里程 作为相关基础设 施的代表 理论模型的设定其中 : 第 t 年全国国内旅游收入数据的收集与处理1994年2011年中国旅游收入及相关数

14、据 年份国内旅游收入Y(亿亿元)国内旅游人数X2(万人次)城镇镇居民人均旅游花费费X3(元)农农村居民人均旅游花费费X4 (元)铁铁路里程X5(万公里)19941023.552400414.754.95.9019951375.762900464.061.55.9719961638.463900534.170.56.4919972112.764400599.8145.76.6019982391.269450607.0197.06.6419992831.971900614.8249.56.7420003175.574400678.6226.66.8720013522.478400708.3212.

15、77.0120023878.487800739.7209.17.1920033442.387000684.9200.07.3020044710.7110200731.8210.27.4420055285.9121200737.1227.67.5420066229.74139400766.4221.97.7120077770.62161000906.9222.57.8020088749.3 171200849.4 275.38.0 200910183.7 190200801.1 295.38.6 201012579.8 210300883.0306.09.1 201119305.4 264100

16、877.8 471.49.3 该模型,可决系数较高,F检验值 225.85,明显显著。 但是当时、OLS 估计的结果不仅X5的系数不显著, 而且X3、X5的符号与预 期相反,这表明可能存 在严重的多重共线性。计算各解释变量的相关系数 表明各解释变量间确实存在严重的线性关系X2X3X4X5X2 1.0000000.837135 0.846417 0.962193X3 0.8371351.000000 0.824165 0.902770X4 0.8464170.824165 1.000000 0.884279X5 0.9621930.902770 0.884279 1.000000将每个解释变量分别作为被解释变量对其余的解释变量 进行辅助回归,回归所得到的可决系数和方差扩

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号