《因果推断实用计量方法》大学教学课件第10章工具变量

上传人:O**** 文档编号:181843947 上传时间:2021-05-06 格式:PPTX 页数:47 大小:3.96MB
返回 下载 相关 举报
《因果推断实用计量方法》大学教学课件第10章工具变量_第1页
第1页 / 共47页
《因果推断实用计量方法》大学教学课件第10章工具变量_第2页
第2页 / 共47页
《因果推断实用计量方法》大学教学课件第10章工具变量_第3页
第3页 / 共47页
《因果推断实用计量方法》大学教学课件第10章工具变量_第4页
第4页 / 共47页
《因果推断实用计量方法》大学教学课件第10章工具变量_第5页
第5页 / 共47页
点击查看更多>>
资源描述

《《因果推断实用计量方法》大学教学课件第10章工具变量》由会员分享,可在线阅读,更多相关《《因果推断实用计量方法》大学教学课件第10章工具变量(47页珍藏版)》请在金锄头文库上搜索。

1、第10章:工具变量,大纲,工具变量估计法的直观理解 工具变量两阶段估计法 工具变量估计法的局限性 工具变量估计的检验 工具变量使用步骤和常见问题,工具变量估计法的直观理解,工具变量的作用,如果我们直观地认为处置变量 变化中和干扰项相关的部分为“坏的变化”, 和干扰项不相关的部分为“好的变化”。 工具变量的方法就是将处置变量中“好的变化”分离出来,并只用“好的变化“部分去估计处置变量对被解释变量的因果影响。,通过工具变量清理内生变量以解决内生性问题,工具变量,顾名思义,不同于解释变量,它是帮助我们找到因果关系的工具。 工具变量方法解决内生性走的是另一条途径:它先“清理”掉内生处置变量中和干扰项相

2、关的变化(“坏”的变化),再用和干扰项不相关的变化(“好”的变化)去估计对的作用。,工具变量的要求,一个能达到清理内生变量的工具变量需要“有用”并且“干净”。 要清理出好的部分,本身必须是干净的,( , )=0。我们称这个条件为“外生性”(Exogeneity) 能够清理内生变量, 必须和相关,即( , )0,如果二者不相关,它的变化信息没法帮助我们分离出D “好”的变化,是“没用的”工具变量。,估计方法1:间接最小二乘法(Indirect Least Squares),假设结果方程为: =+ 1 + (1) 是内生变量, , 0 , 内生变量和工具变量的回归关系如下: = 0 + 1 + (

3、2) 将方程(2)带入方程(1),得到: =+ 1 0 + 1 + + = 1 0 0 + 1 1 1 + 1 + 可见工具变量和被解释变量的的关系如下 = 0 + 1 + ,,估计方法1:间接最小二乘法(ILS), 1 = 1 1 , 它的意思是 对的作用 1 = (对的作用) 1 (对的作用) 1 。 因此,要得到对的作用的系数 1 ,我们可以用下面关系得到: (对的作用)= (对的作用) (对的作用) 1 = 1 1,估计方法1:间接最小二乘法(ILS),从回归方程: = 0 + 1 + 得到: 1 =( , )/ 从回归方程: = 0 + 1 + 得到: 1 =( , )/( ) 代入

4、 1 = 1 1 ,我们得到间接最小二乘法的系数估计量 。 1 = ( , )/( ) ( , )/( ) = ( , ) ( , ),估计方法2:两阶段最小二乘法(Two Stages Least Square, 2SLS),第一阶段通过工具变量 将 分解为两个不相关的变量, = + ,其中 = 0 + 1 , 分解可以通过将 对 回归,得到: = + = 0 + 1 + 回归分解后 , =0,因此 , =0, 也和不相关, 是 中“好的部分”。,估计方法2:两阶段最小二乘法(2SLS),第二阶段用中“好的部分” 估计对的影响,将分解后的代入公式,得到: =+ 1 + =+ 1 + + =+

5、 1 + + 由于 = 0 + 1 与 和 都不相关,因此 ( , )=0,对回归可以得到正确的 1,估计方法2:两阶段最小二乘法(2SLS), 1 2 = , = , 0 + 1 0 + 1 = 1 , 1 2 = , 1 = , , = , , 我们看到两阶段最小二乘法 1 2 得到的系数和间接最小二乘法得到的系数 是一样的, 1 2 = 1 = ( , ) ( , ),工具变量数量,识别不足:工具变量的数量内生变量的数量。这两种方法都没法估计出模型中内生变量的系数 1 。 刚好识别:工具变量数量=内生变量数量。模型中内生变量的系数可以得到唯一的估计值,比如模型只有一个内生变量和一个工具变

6、量,ISL法和2LSL法将得到相同的唯一解。,工具变量数量,过度识别:工具变量数量内生变量数量。如果分别使用不同工具变量,会得到不同的 1 估计值。 2SLS提供了一个多工具变量的“最佳组合“方法。它通过第一阶段的回归找到两个工具变量的线性组合 1 1 + 1 2 来最佳地拟合,即通过回归方程: = 0 + 1 1 + 2 2 + 。 第二阶段将 对 回归: =+ 1 + 。 由于 和 不相关,得到 1 2 是 1 一致估计量。,工具变量两阶段估计法,模型设置,我们要估计的结果模型是: =+ 1 1 + 2 2 + + 其中 1 是一个内生变量,Cov 1 , 0, 2 , 是其他外生变量。

7、1 有一个工具变量 1 。,合理的工具变量需要满足的条件,外生性(干净): 1 和结果模型中的干扰项 不相关, 1 , =0,即当控制了模型里所有解释变量(包括内生变量和其他外生变量变量)对 的作用后, 对 没有作用。 相关性(有用):在内生变量 1 和工具变量 1 和其它外生变量的回归关系中, 1 = 0 + 1 1 + 2 2 + + , 工具变量的系数 1 0。即当控制了模型里所有外生变量和 1 的相关性后, 1 和 1 仍然存在相关性。具体而言,,合理的工具变量需要满足的条件,模型估计:一个内生变量和一个工具变量,第一阶段:将内生变量对工具变量和所有外生变量做回归 1 内生变量 = 0

8、 + 1 1 工具变量 + 2 2 + 所有的外生变量 + 用得到的估计系数 ( 0 , 1 , 2 , )计算内生变量的预测值: 1 = 0 + 1 1 + 2 2 + 。 这个预测值 1 不和 相关,它是 1 中“好”的变化部分。,模型估计:一个内生变量和一个工具变量,第二阶段:将预测值 1 替代结果模型中的内生变量 1 并进行回归 =+ 1 1 预测值 + 2 2 + 所有的外生变量 + 得到 1 的系数 1 2 称为样本两阶段最小二乘法(2SLS)系数。 由于在第二阶段回归中只使用了 1 中和干扰项不相关的“好”的变化部分 1 ,因此得到的 1 2 是系数 1 的一致估计量 1 2 =

9、 1 。,模型估计:多个内生变量和多个工具变量,2SLS可以很方便地处理有多个内生变量和多个工具变量的情况。 假设我们要估计的模型是: =+ 1 1 + 2 2 + 3 3 + + 其中 1 和 2 是内生变量。 1 有个工具变量 1 , 2 有两个工具变量 2 和 3 。,模型估计:多个内生变量和多个工具变量,第一阶段:将每个内生变量单独对所有工具变量和所有其它外生变量做回归: 1 内生变量 = 0 + 1 1 + 2 2 + 3 3 所有工具变量 + 4 3 + +1 所有其他外生变量 + 1 2 内生变量 = 0 + 1 1 + 2 2 + 3 3 所有的工具变量 + 4 3 + +1

10、所有其他外生变量 + 2 用得到的系数计算每个内生变量的预测值: 1 = 0 + 1 1 + 2 2 + 3 3 + 4 3 + +1 2 = 0 + 1 1 + 2 2 + 3 3 + 4 3 + +1 ,模型估计:多个内生变量和多个工具变量,第二阶段:用内生变量的预测值替代结果模型中的内生变量并进行回归 =+ 1 1 + 2 2 预测值 + 3 3 + 所有的外生变量 + 得到 1 和 2 的2SLS估计系数 1 2 和 2 2 是 1 和 2 的一致估计量。,工具变量估计法的局限性,理解工具变量估计法的局限性,为方便我们理解工具变量估计法的局限性,我们考虑简单的单变量两阶段模型 =+ 1

11、 + = 0 + 1 + 其中 是内生变量, 是工具变量。 系数 1 的样本两阶段估计量 为 1 2 = ( , ) ( , ),大样本下的局限性 (偏差性), 1 2 的大样本概率极限值为: 1 2 = ( , ) ( , ) = 1 + ( , ) ( , ) = 1 + , , 2SLS大样本偏差项 当工具变量是完全外生,即 , =0,2SLS大样本偏差项为0, 1 2 是一致估计量 (当样本足够大,估计量趋近真实值)。,大样本下的局限性 (偏差性), 1 2 = 1 + , , 2SLS大样本偏差项 但如果工具变量不是完全是外生的, , 0,即使偏差项的分子 , 很小,如果工具变量和内

12、生变量的相关性很小,即偏差项里的分母 , 很小,这个偏差也会被放得很大。 和内生变量相关性很小的工具变量称为弱工具变量。,大样本下的局限性(精准性),工具变量两阶段估计量 1 2 是渐近正态分布的, 1 2 N 1 ,Avar 1 2 。 在同方差情况下,其渐进方差为: Avar 1 2 = 2 2 2 其中 2 和 2 分别是干扰项e和内生变量D的方差, 是工具变量和内生变量的相关系数 = Cov D , ,,大样本下的局限性(精准性),如果不考虑内生性而直接使用OLS估计,得到的系数的渐进方差为: 1 = 2 2 对比 1 2 和 1 的方差,得到: Avar 1 2 1 = 1 2 1,

13、比较 1 2 和 1 在大样本下的精准性,工具变量估计量的方差总是大于OLS估计值的方差 在弱工具的情况下,工具变量和内生变量的相关系数 很小,因此能分解出的内生变量“好”的信息很少,工具变量估计系数 1 2 的估计精确度很低,造成方差Avar 1 2 很大。,有限样本下的局限性 (偏差性),在有限样本里,2SLS估计量 2 是有偏的估计量(估计量的期望值不等于真实值),E( 1 2 ) 1 。 Hahn和Hausman(2002)给出了在有限样本里, 1 2 的偏差 1 2 偏差= 1 2 1 = 1 2 1,有限样本下的局限性 (精确性),在有限样本里,我们不知道 1 2 的分布。 样本方

14、差 ( 1 2 )在有限样本通常偏小,尤其是当工具变量是弱工具变量。这意味着如果使用 ar 1 2 进行t检验我们会过于容易拒绝原假设而得到“显著”结果。因此通常使用的t检验在小样本里不适用。,工具变量的局限性,要注意样本数量。 2SLS的估计系数 1 2 只有在大样本里是一致的,在小样本里是有偏的。 除非确定有内生性,否则应避免使用工具变量估计 避免使用弱工具变量。,工具变量估计的检验,是否需要使用工具变量?(内生性检验),Durbin-Wu-Hausman 2 检验 通过比较工具变量估计值 1 2 和OLS估计值 1 来检验变量外生性的方法。 0 : 是外生的,检验统计量: H= 1 2

15、1 ( 1 2 )( 1 ) 1 ( 1 2 1 ) 2 在原假设下OLS和工具变量得到的参数估计量是一致的,因此 1 2 1 和H值应该接近零。,内生性检验的局限性,检验一个变量是否是外生的前提条件是我们有一个有效的工具变量(满足相关性和外生性),如果工具变量本身不是有效的,检验出来的结果是无效的。,工具变量是否满足相关性?(弱工具变量检验),如果只有一个内生变量,一个简单的检验方法就是观察2SLS中第一阶段的关于所有工具变量的系数同时为0的F检验。当工具变量数量为1,2,3,5,10时,Stock, Wright, and Yogo (2002)建议第一阶段的F统计量的关键值设为8.96,

16、11.59,12.83,15.09和22.88。如果第一阶段的F检验值低于这些关键值,则可能存在弱工具变量问题。,工具变量是否是外生的?(过度识别检验),恰当识别(工具变量的数量=内生变量的数量)情况下,我们无法对外生性假设进行检验。 因为要检验Cov , e =0, 由于 e 观测不到,我们必须先估计 e i ,再用的它估计值 检验Cov , e =0。但是当我们去估计 = 1 时,我们需要满足外生条件的工具变量才能得到一致的估计值 1 ,从而得到一致的估计量 。因此通过Cov , e =0检验工具变量是否外生是没有意义的,因为要得到一致的估计量 1 ,我们已经假设了工具是外生的。,工具变量是否是外生的?(过度识别检验),过度识别(工具变量的数量内生变量的数量):假设有一个内生变量,两个工具变量( 1 2 ),我们可以采用下面的分步检验方法: 先假设第一个工具变量 1 满足外生性Cov Z 1i , =0,并只用 1 作为工具变量得到系数的估计值 1 1 , 1 1 是 1 一致估计量,因此残差 1 = 1 1 也是 e 一致估计量。接着使用 1 对工具变量 2 的外生性进行检验,即

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号