张自斌课件Chapter 4..

上传人:E**** 文档编号:118220431 上传时间:2019-12-11 格式:PDF 页数:18 大小:283.43KB
返回 下载 相关 举报
张自斌课件Chapter 4.._第1页
第1页 / 共18页
张自斌课件Chapter 4.._第2页
第2页 / 共18页
张自斌课件Chapter 4.._第3页
第3页 / 共18页
张自斌课件Chapter 4.._第4页
第4页 / 共18页
张自斌课件Chapter 4.._第5页
第5页 / 共18页
点击查看更多>>
资源描述

《张自斌课件Chapter 4..》由会员分享,可在线阅读,更多相关《张自斌课件Chapter 4..(18页珍藏版)》请在金锄头文库上搜索。

1、1 Chapter 4 Chapter 4 违反线性模型经典假设的检验及处理违反线性模型经典假设的检验及处理 多重共线性 异方差 自相关 内生性问题 第一节 多重共线性(第一节 多重共线性(multicollinearity) 一、多重共线性概念一、多重共线性概念 原来的含义是指一个回归模型中的一些或全部解释变量()之间存在一种“完全” 或准确的线性关系(完全共线性完全共线性) ;目前,这一概念扩展到一些或全部解释变量之间存 在一种“非完全”但又高度相关的线性关系(非完全共线性非完全共线性) 。 1. 完全准确线性关系完全准确线性关系: 1x1 + 2x2 + . + kxk = 0 1, 2

2、, , k 为常数,不都为 0。 2. 不完全,但高度相关线性关系:不完全,但高度相关线性关系: 1x1 + 2x2 + . + kxk + vi = 0 1, 2, , k 为常数,不都为 0, vi 为随机项。 x1 x2 x2* 10 50 52 15 75 75 18 90 97 24 120 129 30 150 152 x2 与 x1之间是完全线形关系:x2 = 5x1 2 Chapter 4 x2* 与 x1之间是不完全线形关系 x2* = 5x1 + random number random number = 2, 0, 7, 9, 2 二、多重共线性产生的原因二、多重共线性产

3、生的原因 1. 数据采集方法不当;数据采集方法不当; 如在总体中的一个较小范围内抽样,x变化不大。 2. 模型或总体受到限制;模型或总体受到限制; 如建立电力消费对收入和房子面积的回归模型,将受到如下约束:收入高,房子 面积大;收入低,房子面积小。也就是说,收入和房子面积之间存在着共线性关系。 滞后变量的引入: C? ? ?Y? ?C? Ct: 消费; Yt:收入。 3. 模型设立不当;模型设立不当; 如模型中包括 x, x2, x3 作为解释变量时,当 x变化不大时(或较小时) 。 4. 时间序列数据中各个数据可能具有相同的时间趋势。时间序列数据中各个数据可能具有相同的时间趋势。 如 GDP

4、,就业人口,消费等。 三、多重共线性情况下,三、多重共线性情况下,OLS 估计会产生的问题估计会产生的问题 1.完全共线性情况下完全共线性情况下, 不能估计不能估计 educ2 = 2*educ 2. 非完全共线性情况下非完全共线性情况下 consumption vs. income and wealth Source | SS df MS Number of obs = 10 -+- F( 2, 7) = 92.40 Model | 8565.55407 2 4282.77704 Prob F = 0.0000 Residual | 324.445926 7 46.349418 R-squa

5、red = 0.9635 -+- Adj R-squared = 0.9531 Total | 8890 9 987.777778 Root MSE = 6.808 - consumption | Coef. Std. Err. t P|t| 95% Conf. Interval -+- income | .9415373 .8228983 1.14 0.290 -1.004308 2.887383 wealth | -.0424345 .0806645 -0.53 0.615 -.2331757 .1483067 _cons | 24.77473 6.7525 3.67 0.008 8.80

6、7609 40.74186 - 现象:现象: 3 Chapter 4 (1)虽然 BLUE,OLS估计方差大,使精确估计困难 (2)因为(1) ,具有宽的置信区间,容易接受参数为零的原假设 (3)因为(1) ,t 值不显著 (4)F 检验显著 (5)拟合优度 R2很高 原因: 原因: var? ? ? ? SST?1 ? R? ? ? 其中SST? ?income ? ncome? ? ? . R? ? 是从如下的辅助回归中得到的 income = 0 + 1wealth + u 我们称如下公式为方差膨胀因子(variance inflating factor (VIF) ) : VIF ?

7、1 ?1 ? R? ? ? 四、如何检验是否存在多重共线性四、如何检验是否存在多重共线性 1. 高的 R2但是只有几个显著的 t 比值 2. 在解释变量之间存在高的两两相关系数 |r| 0.8 注意:高的两两相关系数是存在多重共线性的充分条件,而不是必要条件。 换句话说,低的两两相关系数也可能推出存在多重共线性。 高的两两相关系数 存在多重共线性 低的两两相关系数 存在多重共线性 比如: y ? ? ?x? ?x? ?x? 假设 x? ?x? ?x? 则有 4 Chapter 4 R?|?,? ? ? 1 ? r? ? ? r? ? ? 2r?r?r? 1 ? r? ? 可以验证如下的相关系数

8、满足上式。 r? 0.5,r? 0.5,r? ?0.5 3. 利用辅助回归(auxiliary regression)的拟合优度 R2判断 y ? ? ?x? ?x? ?x? ?x? 解释变量(X)之间的辅助回归(有几个?) x? ? ?x? ?x? ?x? u 检验如下 F统计量的显著性 F ? R? | ?,?,? ? /3 ?1 ? R? | ?,?,? ? ?/?n ? 4? VIF 10, 辅助回归 R2 0.9, 一般认为多重共线性比较严重。 五、如何处理多重共线性五、如何处理多重共线性 1. 不作任何处理:OLS BLUE 2. 去掉一个变量,但是会造成估计量有偏(Specifi

9、cation Bias) 3. 转换变量 (1)时间序列:一阶差分 (2)Y,X 同时除以一解释变量: consumption = 0 + 1GDP + 2Population + 两边同时除以总人口,变成人均的变量 4. 增加样本容量(多收集数据) ,可能减缓共线性问题 5 Chapter 4 第二节第二节 异方差异方差 (Heteroskedasticity) 一、异方差概念一、异方差概念 Var(i | x1, x2, , xk) = E(i2) = i2 下标 i 表示条件方差是非常数。 例:食品消费与收入关系: 富人有不同的偏好,有的人奢侈,有的人节俭,所以方差大; 穷人虽然有不同的

10、偏好,但是由于受收入的限制,选择范围小,所以方差小。 二、异方差对二、异方差对 OLS 结果的影响结果的影响 因为满足 CLM1-CLM4 假设条件,所以 1. 估计值无偏性、一致性(unbiased and consistent) 2. R2不受影响 3. var? ?有偏(biased) (原因?) 不能够用于建立关于参数的置信区间(confidence intervals) 不能够用于计算 t 统计值 OLS 的 t 统计值不具有 t 分布,使用大样本也不能解决这一问题 4. OLS 不再是 BLUE(最优线性无偏估计) 三、异方差检验 1. 作图法(定性方法) 1. 作图法(定性方法)

11、 (1)作 2 对 Y 的散点图 (2)作 2 对 X 的散点图 0100200300400 ehatsq 50100150200 Linear prediction 0100200300400 ehatsq 100150200250300 income 6 Chapter 4 2. Breusch-Pagan (BP) 检验检验 假设模型为 y ? ? ?x? ?x? ?x? BP检验步骤: (1) 运行 y 对 x1, x2, x3 的回归(OLS y on x1, x2, x3),得到估计值 ?,?,?,?, 计算 fitted value y ? 和残差(residuals) ? y

12、? ? ? ? (2) 计算 ? (3) OLS ? on x1, x2, x3, 得到估计值 ? ? ?x? ?x? ?x? error (4) 检验 Ho: ? ? ? 0 F检验:F统计值在原假设为真条件下服从 F3,n-4 分布; 如果 p 值很小,拒绝原假设,表明具有异方差 3. White 检验检验 步骤: (1)运行 y 对 x1, x2, x3 的回归(OLS y on x1, x2, x3),得到估计值, ?,?,?,?, 计 算 fitted value y ? 和残差(residuals) ? (2)计算 ? (3)OLS ? on x 的一次项、平方项和交叉项 ? ?

13、?x? ?x? ?x? ?x? ? ? ?x? ? ? ?x? ? ?x?x? ?x?x? ?x?x? error (4)检验Ho: ? ? ? ? ? ? 0 小样本情况下 F检验:F统计值在原假设为真条件下服从 F(9,n-10)分布 如果 p值很小,拒绝原假设,表明具有异方差 大样本: nR2 chi-square(9) 7 Chapter 4 如果 x 较多,自由度消耗过多,White 检验改进 (3) error y y 2 210 2 += (4)检验 H0:0, 0 21 = F检验:F统计值在原假设为真条件下服从 F2,n-3 分布 Example: consumption3 data 结果不确定,F检验 P值 0.0713. 去掉平方项。 四、异方差处理四、异方差处理 1 2 21 ),

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号