工具变量回归ppt课件

上传人:汽*** 文档编号:584300766 上传时间:2024-08-30 格式:PPT 页数:100 大小:1.68MB
返回 下载 相关 举报
工具变量回归ppt课件_第1页
第1页 / 共100页
工具变量回归ppt课件_第2页
第2页 / 共100页
工具变量回归ppt课件_第3页
第3页 / 共100页
工具变量回归ppt课件_第4页
第4页 / 共100页
工具变量回归ppt课件_第5页
第5页 / 共100页
点击查看更多>>
资源描述

《工具变量回归ppt课件》由会员分享,可在线阅读,更多相关《工具变量回归ppt课件(100页珍藏版)》请在金锄头文库上搜索。

1、工具变量回归工具变量回归 经典假设经典假设 所有的解释变量所有的解释变量X Xi i与随机误差项与随机误差项彼此之间不相关。彼此之间不相关。若解释变量若解释变量Xi和和ui相关,则相关,则OLS估计量是非估计量是非一致的,也就是即使当样本容量很大时,一致的,也就是即使当样本容量很大时,OLS估计量也不会接近回归系数的真值。估计量也不会接近回归系数的真值。造成误差项与回归变量相关(内生性)的原造成误差项与回归变量相关(内生性)的原因很多,但我们主要考虑如下几个方面:因很多,但我们主要考虑如下几个方面:遗漏变量变量遗漏变量变量变量有测量误差变量有测量误差双向因果关系双向因果关系。遗漏变量偏差遗漏变

2、量偏差可采用在多元回归中加入遗漏变可采用在多元回归中加入遗漏变量的方法加以解决,但前提是只有当你有遗漏量的方法加以解决,但前提是只有当你有遗漏变量数据时上述方法才可行。变量数据时上述方法才可行。双向因果关系偏差双向因果关系偏差是指如果有时因果关系是从是指如果有时因果关系是从X到到Y又从又从Y到到X时,此时仅用多元回归无法消时,此时仅用多元回归无法消除这一偏差。同样,除这一偏差。同样,变量有测量误差变量有测量误差也无法用我们前面学过的方法也无法用我们前面学过的方法解决。解决。因此我们就必须寻找一种新的方法。因此我们就必须寻找一种新的方法。工具变量工具变量(instrumental variabl

3、e, IV)回归回归是当回归变量是当回归变量X与误差项与误差项u相关时获得总体回相关时获得总体回归方程未知系数一致估计量的一般方法。我归方程未知系数一致估计量的一般方法。我们经常称其为们经常称其为IV估计估计。其其基本思想基本思想是:假设方程是:是:假设方程是:我们假设我们假设ui与与Xi相关,则相关,则OLS估计量一定是估计量一定是有偏的和非一致的。有偏的和非一致的。工具变量估计工具变量估计是利用另是利用另一个一个“工具工具”变量变量Z将将Xi分离成与分离成与ui相关和相关和不相关的两部分。不相关的两部分。在经济学中:在经济学中:(1)内生变量内生变量:由模型内的变量所决定:由模型内的变量所

4、决定的变量称作内生变量。的变量称作内生变量。(2)外生变量外生变量:由模型外的变量所决定:由模型外的变量所决定的变量称作外生变量。的变量称作外生变量。重要概念:内生变量和外生变量重要概念:内生变量和外生变量在计量经济学中,把所有与扰动项相关在计量经济学中,把所有与扰动项相关的解释变量都称为的解释变量都称为“内生变量内生变量”。这与。这与一般经济学理论中的定义有所不同。一般经济学理论中的定义有所不同。1。与误差项相关的变量称为。与误差项相关的变量称为内生变量内生变量(endogenous variable)。2。与误差项不相关的变量称为。与误差项不相关的变量称为外生变量外生变量(exogenou

5、s variable)。我们的工作就是要寻找相应的我们的工作就是要寻找相应的工具变量工具变量将解将解释变量分解成内生变量和外生变量,然后利释变量分解成内生变量和外生变量,然后利用用两阶段最小二乘法两阶段最小二乘法(TSLS)进行估计。进行估计。一个例子:考虑货币政策对宏观经济的影响。一个例子:考虑货币政策对宏观经济的影响。由于货币政策的制定者会根据宏观经济的运由于货币政策的制定者会根据宏观经济的运行情况来调整货币政策,故货币政策是个内行情况来调整货币政策,故货币政策是个内生变量(双向因果关系)。生变量(双向因果关系)。Romer (2004)通过阅读历史文献将货币政策的变动分解为通过阅读历史文

6、献将货币政策的变动分解为“内生内生”(对经济的反应)与(对经济的反应)与“外生外生”(货(货币当局的自主调整)的两部分。币当局的自主调整)的两部分。 工具变量的选取工具变量的选取 一个有效的工具变量必须满足称为一个有效的工具变量必须满足称为工具变量相关工具变量相关性性和和工具变量外生性工具变量外生性两个条件两个条件:即即 (1)工具变量相关性工具变量相关性:工具变量与所替代的:工具变量与所替代的随机解释变量高度相关;随机解释变量高度相关; (2)工具变量外生性:工具变量外生性:工具变量与随机误差项工具变量与随机误差项不相关;不相关; 两阶段最小二乘估计量两阶段最小二乘估计量若工具变量若工具变量

7、Z满足工具变量相关性和外生性的满足工具变量相关性和外生性的条件,则可用称为条件,则可用称为两阶段最小二乘两阶段最小二乘(TSLS)的的IV估计量估计系数估计量估计系数 1 1。两阶段最小二乘估计量分两阶段计算:两阶段最小二乘估计量分两阶段计算:第一阶段第一阶段把把X分解成两部分:即与回归误差项分解成两部分:即与回归误差项相关的一部分以及与误差项无关的一部分。相关的一部分以及与误差项无关的一部分。第二阶段第二阶段是利用与误差项无关的那部分进行估是利用与误差项无关的那部分进行估计。计。具体来说:具体来说:第一阶段:将第一阶段:将X分解成与分解成与X高度相关的外生变量高度相关的外生变量Z以及与干扰项

8、以及与干扰项ui相关的部分相关的部分vi。工具变量回归工具变量回归谁开创了工具变量回归?谁开创了工具变量回归?1928年的著作的年的著作的“The Tariff on Animal and Vegetable Oils”的附录的附录B。作者是谁?作者是谁?Philip Wright 还是他的儿子还是他的儿子Sewall Wright文体计量学的分析文体计量学的分析为什么为什么IV回归是有效的?回归是有效的?例例1: Philip Wright的问题的问题Philip Wright关心的是那个时期的一个重要关心的是那个时期的一个重要经济问题:即如何对诸如黄油,大豆油这样的经济问题:即如何对诸如黄

9、油,大豆油这样的动植物油和食用动物设置进口关税。在动植物油和食用动物设置进口关税。在20世纪世纪20年代,进口关税是美国主要的税收收入来源。年代,进口关税是美国主要的税收收入来源。而理解关税的经济效应的关键在于要有商品需而理解关税的经济效应的关键在于要有商品需求和供给曲线的定量估计。由前知供给弹性为求和供给曲线的定量估计。由前知供给弹性为价格上涨价格上涨1%引起的供给量变化的百分率,而引起的供给量变化的百分率,而需求弹性为价格上涨需求弹性为价格上涨1%引起的需求量的百分引起的需求量的百分率变化。率变化。例如具休考虑黄油的需求弹性估计问题:例如具休考虑黄油的需求弹性估计问题:根据根据11个均衡样

10、本点估计的方程究竟是需求函数还是个均衡样本点估计的方程究竟是需求函数还是供给函数?两者都不是。由于这些点是由需求和供给供给函数?两者都不是。由于这些点是由需求和供给两者的变化确定的,因此用两者的变化确定的,因此用OLS拟合这些点的直线既拟合这些点的直线既不是需求曲线也不是供给曲线的估计。不是需求曲线也不是供给曲线的估计。利用这些样本点估计出来的利用这些样本点估计出来的OLS拟合线是需求曲拟合线是需求曲线还是供给曲线,都不是!两个极端的情况如图:线还是供给曲线,都不是!两个极端的情况如图:因此,由于这些点是由需求和供给两者的变化因此,由于这些点是由需求和供给两者的变化确定的,因此用确定的,因此用

11、OLS拟合这些点的直线既不是拟合这些点的直线既不是需求曲线也不是供给曲线的估计。需求曲线也不是供给曲线的估计。Wright的解决办法:的解决办法:1。找到第三个变量,。找到第三个变量,这个变量影响供给但不这个变量影响供给但不影响需求影响需求。这样,所有的均衡价格和均衡量对。这样,所有的均衡价格和均衡量对都落在这条稳定的需求曲线上,此时很容易估都落在这条稳定的需求曲线上,此时很容易估计出它的斜率。计出它的斜率。2。可见,这第三个变量,也就是工具变量,。可见,这第三个变量,也就是工具变量,它与价格相关它与价格相关(它使供给曲线移动,于是导致它使供给曲线移动,于是导致价格发生变化价格发生变化),但与

12、,但与u无关无关(需求曲线保持不需求曲线保持不变变)。3。Wright考虑了几个可能的工具变量;其考虑了几个可能的工具变量;其中一个是天气。例如,某牧场的中一个是天气。例如,某牧场的降雨量降雨量低于低于平均值会使牧草减少从而减少给定价格时黄平均值会使牧草减少从而减少给定价格时黄油的产量油的产量(会使供给曲线向左移动而使均衡会使供给曲线向左移动而使均衡价格上升价格上升),因此牧场地区降雨量满足工具,因此牧场地区降雨量满足工具变量相关性的条件。但牧场地区降雨量对黄变量相关性的条件。但牧场地区降雨量对黄油的需求没有直接影响,因此牧场地区降雨油的需求没有直接影响,因此牧场地区降雨量与量与ui的相关系数

13、为零;也就是牧场地区降的相关系数为零;也就是牧场地区降雨量满足工具变量外生性条件。雨量满足工具变量外生性条件。上图表明若某个变量使供给曲线移动而使需求保待不上图表明若某个变量使供给曲线移动而使需求保待不变时会发生什么样的情况。现在所有的均衡价格和均变时会发生什么样的情况。现在所有的均衡价格和均衡量对都落在这条稳定的需求曲线衡量对都落在这条稳定的需求曲线例例2:班级模型对测试成缓的效应估计:班级模型对测试成缓的效应估计 尽管控制了学生和地区特征,但由于受诸如校尽管控制了学生和地区特征,但由于受诸如校外学习机会或教师质量等不可测变量的影响,第外学习机会或教师质量等不可测变量的影响,第二篇中给出的班

14、级规模对测试成绩的效应估计中二篇中给出的班级规模对测试成绩的效应估计中仍然可能存在着遗漏变量偏差。若这些变量的数仍然可能存在着遗漏变量偏差。若这些变量的数据不可得,则不能通过在多元回归中加入这些变据不可得,则不能通过在多元回归中加入这些变量的方法来处理遗漏变量偏差。量的方法来处理遗漏变量偏差。工具变量回归提供了解决这一问题的一工具变量回归提供了解决这一问题的一种思路。考虑下面的假想例子:由于夏种思路。考虑下面的假想例子:由于夏天发生了地震,为了进行灾后修复工作,天发生了地震,为了进行灾后修复工作,必须关闭某些加利福尼亚州的学校。而必须关闭某些加利福尼亚州的学校。而最靠近震中的地区受到的影响最严

15、重。最靠近震中的地区受到的影响最严重。于是有学校关闭的地区需要把学生于是有学校关闭的地区需要把学生“挤挤在一起在一起”,因此暂时扩大了班级规模。,因此暂时扩大了班级规模。这意味着这意味着到震中的距离到震中的距离与班级规模相关,与班级规模相关,故它满足工具变最相关性的条件但如果故它满足工具变最相关性的条件但如果到震中的距离与其他影响学生成绩的因到震中的距离与其他影响学生成绩的因素无关素无关(如学生是否还在学习英语如学生是否还在学习英语),则由,则由于它与误差项无关因此是外生的。于是于它与误差项无关因此是外生的。于是到震中的距离这个工具变量可以用来避到震中的距离这个工具变量可以用来避免遗漏变量偏差

16、和估计班级规模对测试免遗漏变量偏差和估计班级规模对测试成绩的效应。成绩的效应。TSLS估计量的抽样分布估计量的抽样分布为了简单起见,我们仅考虑只有一个回归变为了简单起见,我们仅考虑只有一个回归变量量X和一个工具变量和一个工具变量Z的情况。的情况。即,参数的即,参数的TSLS估计量估计量为为Z和和Y的样的样本协方差与本协方差与Z和和X的样本协的样本协方差之比。方差之比。假设原方程为:假设原方程为:即总体系数为即总体系数为Z和和Y的总体的总体协方差与协方差与Z和和X的总体协方的总体协方差之比。差之比。在香烟需求中的应用在香烟需求中的应用为了减少由于吸烟导致的疾病和死亡,以及为了减少由于吸烟导致的疾

17、病和死亡,以及这些生病的人对社会其他成员产生的成本或这些生病的人对社会其他成员产生的成本或外部性,一种方法是对香烟征收重税从而减外部性,一种方法是对香烟征收重税从而减少吸烟同时阻止潜在的新吸烟者。但具体需少吸烟同时阻止潜在的新吸烟者。但具体需要增加多大幅度的税收来削减香烟的消费呢要增加多大幅度的税收来削减香烟的消费呢?例如,若要使香烟消费减少?例如,若要使香烟消费减少20%则香烟的则香烟的税后售价应该是多少?税后售价应该是多少?若需求弹性为若需求弹性为-1,使价格上涨,使价格上涨20%就能达到就能达到减少减少20%消费量的目标。若弹性为消费量的目标。若弹性为-0.5,则,则价格必须上涨价格必须

18、上涨40%才能使消费下降才能使消费下降20%。同同philip Wright对黄油的研究一样。我们无对黄油的研究一样。我们无法通过数量对数关于价格对数的法通过数量对数关于价格对数的OLS回归得到回归得到香烟需求弹性的一致估计。香烟需求弹性的一致估计。我们利用我们利用TSLS和和1985-1995年美国年美国48个大个大陆州的年度数据估计了香烟的需求弹性。陆州的年度数据估计了香烟的需求弹性。模型假定:模型假定:被解释变量:被解释变量:香烟消费,即为州内每人购买香烟消费,即为州内每人购买的香烟包数。的香烟包数。内生解释变量:内生解释变量:包含所有税收的每包香烟的包含所有税收的每包香烟的实际平均价格

19、。实际平均价格。工具变量:工具变量:由一般销售税征收的香烟税收。由一般销售税征收的香烟税收。这个工具变量设定是否合理?这个工具变量设定是否合理? 工具变量的相关性:工具变量的相关性:由于高销售税增加了总的由于高销售税增加了总的销售价格销售价格 ,因此每包香烟的销售税满,因此每包香烟的销售税满足工具变量相关性的条件。足工具变量相关性的条件。工具变量的外生性:工具变量的外生性:若销售税是外生的,则必若销售税是外生的,则必须与需求方程中的误差无关;即销售税必然只须与需求方程中的误差无关;即销售税必然只是通过价格间接影响香烟的需求。这看上去是是通过价格间接影响香烟的需求。这看上去是合理的:主要是因为不

20、同州选择了不同的销售合理的:主要是因为不同州选择了不同的销售额、收入、财产和其他公共财政事业的混合税额、收入、财产和其他公共财政事业的混合税收,所以不同州的一般销售税是不同的。其中收,所以不同州的一般销售税是不同的。其中关于公共财政的选择受到政治考量的驱使而不关于公共财政的选择受到政治考量的驱使而不是受香烟需求有关的因素影响。是受香烟需求有关的因素影响。结论:这种工具变量的设置方法是合理的。结论:这种工具变量的设置方法是合理的。因此我们利用两阶段最小二乘法因此我们利用两阶段最小二乘法(TSLS):第一阶段结果:第一阶段结果:第二阶段结果:第二阶段结果:32香烟需求 (续) 33STATA 实例

21、: 香烟需求,第一阶段34第二阶段35结合到一个命令中一般一般IV回归模型回归模型1.因变量因变量 Yi。2.外生解释变量外生解释变量 Wi。3.内生解释变量内生解释变量 Xi。4.我们引入的工具变量我们引入的工具变量Zi。更为详细的说明更为详细的说明引入工具变量的个数引入工具变量的个数假设我们有假设我们有n个内生解释变量,引入了个内生解释变量,引入了m个工个工具变量,具变量,n和和m的关系是什么?的关系是什么?n=m 恰好识别恰好识别 nm 不可识别不可识别 只有恰好识别和过度识别才能用只有恰好识别和过度识别才能用IV方法估计。方法估计。一般一般IV模型的模型的TSLS对一般的对一般的IV回

22、归模型,我们需要修改工具变量的相关回归模型,我们需要修改工具变量的相关性和外生性条件。性和外生性条件。相关性条件:相关性条件:1. 当包含一个内生变量但有多个工具变量时,工具当包含一个内生变量但有多个工具变量时,工具变量相关性的条件为给定变量相关性的条件为给定W时至少有一个时至少有一个Z对预测对预测X是有用的(相关的)。是有用的(相关的)。2. 当包含多个内生变量时,不但要排除完全多重共当包含多个内生变量时,不但要排除完全多重共线性问题,而且工具变量必须提供关于这些变量外生线性问题,而且工具变量必须提供关于这些变量外生性变动的足够信息,以分离出它们各自对性变动的足够信息,以分离出它们各自对Y的

23、效应。的效应。外生性条件:外生性条件:工具变量外生性条件的一般叙述为每个工具变量必须工具变量外生性条件的一般叙述为每个工具变量必须与误差项与误差项ui不相关。不相关。一般一般IV模型中的工具变量相关性模型中的工具变量相关性和外生性和外生性IV回归假设和回归假设和TSLS估计量的抽样估计量的抽样分布分布基于基于TSLS估计量的推断估计量的推断在香烟需求中的应用在香烟需求中的应用在上一节中,我们基于在上一节中,我们基于1995年美国年美国48个州的年消费个州的年消费数据利用包含一个回归变量数据利用包含一个回归变量(每包香烟的实际价格对每包香烟的实际价格对数数)和一个工具变量和一个工具变量(每包香烟

24、的实际销售税每包香烟的实际销售税)的的TSLS估计了香烟的需求弹性。估计了香烟的需求弹性。但这个估计并非没有问题的。但这个估计并非没有问题的。收入会影响需求,它是总体回归误差的一部分。若收入会影响需求,它是总体回归误差的一部分。若州销售税与州的收入有关,则它与香烟需求方程误州销售税与州的收入有关,则它与香烟需求方程误差项中的某个变量相关。这违反了工具变量外生性差项中的某个变量相关。这违反了工具变量外生性的条件。会导致的条件。会导致IV估计量是非一致的。因此我们需估计量是非一致的。因此我们需要在回归中加入收入这一变量。要在回归中加入收入这一变量。除了工具变量除了工具变量SaleTaxi外,我们增

25、加一个新的工外,我们增加一个新的工具变量具变量香烟专项香烟专项税税CigTaxi,香烟专项税提高了,香烟专项税提高了消费者支付的香烟价格,因此可证明它满足工具消费者支付的香烟价格,因此可证明它满足工具变量相关性的条件。同时它与州香烟需求方程中变量相关性的条件。同时它与州香烟需求方程中的误差项不相关,因此它是外生工具变量。的误差项不相关,因此它是外生工具变量。有了这个工具变量后我们就有了每包香烟的实际销售税有了这个工具变量后我们就有了每包香烟的实际销售税和每包香烟的实际州专项税两个工具变量。因此需求弹和每包香烟的实际州专项税两个工具变量。因此需求弹性是过度识别的,即工具变量的个数性是过度识别的,

26、即工具变量的个数(m=2)大于包含的大于包含的内生变量个数内生变量个数(k=1)。现在我们就可以利用现在我们就可以利用TSLS估计需求弹性了,其中第一估计需求弹性了,其中第一阶段回归中的回归变量为包含的外生变帚阶段回归中的回归变量为包含的外生变帚ln(Inci)和两和两个工具变量。个工具变量。结果,使得标准误差变小。结果,使得标准误差变小。50实例: 香烟的需求51实例:香烟需求,一个工具 52实例: 香烟需求, 两个工具53工具变量有效性的检验工具变量有效性的检验假设假设1:工具变量相关性:工具变量相关性工具变量相关性越强,也就是工具变量能解释越多的工具变量相关性越强,也就是工具变量能解释越

27、多的X变动,则变动,则IV回归中能用的信息就越多,因此利用相回归中能用的信息就越多,因此利用相关性更强的工具变量得到的估计量也更精确。关性更强的工具变量得到的估计量也更精确。弱工具变量:弱工具变量:如果虽然如果虽然 但是但是弱工具变量几乎不能解释弱工具变量几乎不能解释X的变动。的变动。例子:例子:在香烟实例中,我们可证明州到香烟生产厂在香烟实例中,我们可证明州到香烟生产厂家的距离是一个弱工具变量:虽然远距离提家的距离是一个弱工具变量:虽然远距离提高了运输成本高了运输成本(因此使供给曲线向内移动,从因此使供给曲线向内移动,从而使均衡价格上升而使均衡价格上升),但香烟很轻,因此运输,但香烟很轻,因

28、此运输成本只占到了香烟价格中的很小部分。故价成本只占到了香烟价格中的很小部分。故价格变动量中由运输成本也就是到生产厂家的格变动量中由运输成本也就是到生产厂家的距离解释的部分可能非常小。距离解释的部分可能非常小。为什么弱工具变量是个问题为什么弱工具变量是个问题如果工具变量是弱的,那么即使当样本容量较如果工具变量是弱的,那么即使当样本容量较大时用正态分布近似大时用正态分布近似TSLS估计量的抽样分布估计量的抽样分布效果仍然很差。因此即便是在大样本下仍然缺效果仍然很差。因此即便是在大样本下仍然缺乏常用统计推断方法的理论依据。事实上,如乏常用统计推断方法的理论依据。事实上,如果工具变量较弱,则果工具变

29、量较弱,则TSLS估计量严重偏离估计量严重偏离OLS估计量的方向。此外,用估计量的方向。此外,用TSLS估计量估计量1.96标准误差构造的标准误差构造的95%置信区问包含系数置信区问包含系数真值的次数远小于真值的次数远小于95%,简言之,若工具变,简言之,若工具变量较弱则量较弱则TSLS不再是可靠的了。不再是可靠的了。弱工具变量会使得分母变得很小,甚至弱工具变量会使得分母变得很小,甚至为为0,导致结果严重偏离。,导致结果严重偏离。一个内生回归变最时弱工具变量一个内生回归变最时弱工具变量的检验的检验当只有一个内生回归变量时检验弱工具变量的当只有一个内生回归变量时检验弱工具变量的一种方法是利用一种

30、方法是利用F统计量检验统计量检验TSLS第一阶段回第一阶段回归中工具变量系数都为零的假设。归中工具变量系数都为零的假设。第一阶段第一阶段F统计量,度量了工具变量中包含的统计量,度量了工具变量中包含的信息:包含的信息越多,则信息:包含的信息越多,则F统计量的期望值统计量的期望值越大。经验法则是如果第一阶段越大。经验法则是如果第一阶段F统计量应该统计量应该超过超过10。即检验即检验Z1、 Z2 、Zm的联合显著性。的联合显著性。test Z1=Z2=Zm=0 计算计算F值值 然后和然后和10比较。比较。如果存在弱工具变量该怎么办?如果存在弱工具变量该怎么办?1. 如果有很多工具变量,有少数强工具变

31、量和如果有很多工具变量,有少数强工具变量和许多弱工具变量,可以忽略最弱的工具变量而许多弱工具变量,可以忽略最弱的工具变量而选用相关性最强的工具变量子集。选用相关性最强的工具变量子集。2. 但如果系数是恰好识别的,则你不能略去弱但如果系数是恰好识别的,则你不能略去弱工具变量。即使系数是过度识别的,但你可能工具变量。即使系数是过度识别的,但你可能没有足够的强工具变量用于识别,因此略去一没有足够的强工具变量用于识别,因此略去一些弱工具变量也没有什么帮助。在这种情况下,些弱工具变量也没有什么帮助。在这种情况下,有两个选择:有两个选择:第一个选择第一个选择是寻找其他较强的工具变量。是寻找其他较强的工具变

32、量。(难难度较大度较大)第二个选择第二个选择是利用弱工具变量继续进行实证分是利用弱工具变量继续进行实证分析,但采用的方法不再是析,但采用的方法不再是TSLS。而是对弱工。而是对弱工具变量不太敏感的有限信息极大似然法具变量不太敏感的有限信息极大似然法(LIML)。在大样本下,。在大样本下,LIML 与与2SLS是渐近是渐近等价的,但在存在弱工具变量的情况下,等价的,但在存在弱工具变量的情况下,LIML 的小样本性质可能优于的小样本性质可能优于2SLS。假设假设2:工具变量外生性:工具变量外生性如果工具变量不是外生的,则如果工具变量不是外生的,则TSLS是非一致是非一致的。工具变量回归的思想毕竟是

33、工具变量中的。工具变量回归的思想毕竟是工具变量中包含与误差项包含与误差项ui不相关的不相关的Xi变动信息。若工具变动信息。若工具变量实际上不是外生的,则它不能正确指出变量实际上不是外生的,则它不能正确指出Xi中的外生性变动,因此表明利用中的外生性变动,因此表明利用IV回归无回归无法得到一致的估计量。法得到一致的估计量。工具变量外生性的检验工具变量外生性的检验刚才我们提到:只有刚才我们提到:只有恰好识别恰好识别和和过度识别过度识别才才能用能用IV方法估计。方法估计。恰好识别:恰好识别:工具变量个数工具变量个数=内生变量个数内生变量个数过度识别:过度识别:工具变量个数工具变量个数内生变量个数内生变

34、量个数一个很重要的命题是:一个很重要的命题是:只有过度识别只有过度识别情况下情况下才能检验工具变量的外生性,而恰好识别情才能检验工具变量的外生性,而恰好识别情况下无法检验。况下无法检验。过度识别约束检验过度识别约束检验基本思想:基本思想:假设有一个内生回归变量,两个工具变量且没有包含假设有一个内生回归变量,两个工具变量且没有包含的外生变量。则你可以计算两个不同的的外生变量。则你可以计算两个不同的TSLS估计量:估计量:其中一个利用第一个工具变量,而另一个利用第二个其中一个利用第一个工具变量,而另一个利用第二个工具变量。由于抽样变异性,这两个估计量不会相同,工具变量。由于抽样变异性,这两个估计量

35、不会相同,但如果两个工具变量都是外生的,则这两个估计量往但如果两个工具变量都是外生的,则这两个估计量往往比较接近。如果由这两个工具变量得到估计非常不往比较接近。如果由这两个工具变量得到估计非常不同,则你可以得出其中一个或两个工具变量都有内生同,则你可以得出其中一个或两个工具变量都有内生性问题的结论。性问题的结论。在恰好识别情况下,假设考虑只包含一个内在恰好识别情况下,假设考虑只包含一个内生变量生变量(k=1)的情况。此时如果有两个工具的情况。此时如果有两个工具变量,可以计算出两个变量,可以计算出两个TSLS估计量,其中每估计量,其中每个工具变量对应一个估计量,然后可以将两个工具变量对应一个估计

36、量,然后可以将两者进行比较看看它们是否接近。者进行比较看看它们是否接近。但如果你只有一个工具变量,则只能计算出但如果你只有一个工具变量,则只能计算出一个一个TSLS估计量,这样就无法进行比较了。估计量,这样就无法进行比较了。更直观地看,如果系数是恰好识别的,此时更直观地看,如果系数是恰好识别的,此时m=k,那么过度识别检验统计量,那么过度识别检验统计量J恰好为零。恰好为零。一个综合的例子一个综合的例子工具变量选择的要求:工具变量选择的要求: 1。相关性:工具变量与内生解释变量高度。相关性:工具变量与内生解释变量高度相关,即相关,即Cov(xt,Zt) 0。 2。外生性:工具变量与扰动项不相关,

37、即。外生性:工具变量与扰动项不相关,即Cov(Zt,ut) =0。 使用工具变量有两种方法:二阶段最小二乘使用工具变量有两种方法:二阶段最小二乘法法(TSLS)和广义矩估计法和广义矩估计法(GMM)。二阶段最小二乘法:二阶段最小二乘法:2SLS 主要思想:进行两阶段回归。主要思想:进行两阶段回归。假设方程为:假设方程为: y=b1x1+b2x2+u 其中其中x1是外生变量,是外生变量,x2是内生变量,找到两是内生变量,找到两个变量个变量z1和和z2,作为,作为x2的工具变量。的工具变量。第一阶段回归:第一阶段回归:reg x2 x1 z1 z2 x2结合了结合了z1和和z2的信息,此时的信息,

38、此时取出取出x2的拟合值的拟合值x2_hat。第二阶段回归:第二阶段回归: reg y x1 x2_hat我们利用数据集我们利用数据集grilic.dta估计教育投资的回估计教育投资的回报率。报率。变量说明:变量说明:lw80(80年工资对数),年工资对数),s80(80年时受教育年限),年时受教育年限),expr80(80年年时工龄),时工龄),tenure80(80年时在现单位工作年时在现单位工作年限),年限), iq(智商),(智商),med(母亲的教育年(母亲的教育年限),限),kww(在(在knowledge of the World of Work测试中的成绩),测试中的成绩),m

39、rt(婚姻虚拟变(婚姻虚拟变量,已婚量,已婚=1),),age(年龄)。(年龄)。建立如下初始方程:建立如下初始方程: use grilic.dta,clear reg lw80 s80 expr80 tenure80 继续对方程进行分析:我们发现了如下问题:继续对方程进行分析:我们发现了如下问题:1。遗漏变量问题:认为方程遗漏了。遗漏变量问题:认为方程遗漏了“能力能力”这个变量,加入这个变量,加入iq(智商)作为(智商)作为“能力能力”的代的代理变量。理变量。2。测量误差问题:。测量误差问题:iq(智商)对(智商)对“能力能力”的的测量存在误差。测量存在误差。3。变量内生性问题:。变量内生性

40、问题:s80可能与扰动项中除可能与扰动项中除“能力能力”以外的其他因素相关,因此是内生变以外的其他因素相关,因此是内生变量。量。解决方法:引入四个变量解决方法:引入四个变量med,kww,mrt,age,作为内生解释变量,作为内生解释变量iq与与s80的工具变量。的工具变量。然后使用然后使用TSLS方法进行回归。方法进行回归。ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first 几点注意事项:几点注意事项:1. first选项的目的是显示选项的目的是显示TSLS第一阶段的结果,如第一阶段的结果,如果省略,则仅显示

41、第二阶段的结果。果省略,则仅显示第二阶段的结果。2. 命令的用法比较严格,将被解释变量和所有外生命令的用法比较严格,将被解释变量和所有外生解释变量放到括号外面,内生解释变量放到括号里面,解释变量放到括号外面,内生解释变量放到括号里面,等号后面为所有工具变量。等号后面为所有工具变量。3。2SLS只能通过只能通过stata完成,利用定义手动计算的完成,利用定义手动计算的结果是错误的,因为残差序列是错误的。结果是错误的,因为残差序列是错误的。4。不可能单独为每个内生变量指定一组特定的工具。不可能单独为每个内生变量指定一组特定的工具变量,而是给所有内生变量指定一系列工具变量变量,而是给所有内生变量指定

42、一系列工具变量 。5。所有外生变变量都作为自己的工具变量。所有外生变变量都作为自己的工具变量。6。为了检验工具变量的外生性,本题为过度识别。为了检验工具变量的外生性,本题为过度识别。7。在大样本下,。在大样本下,IV 估计是一致的,但在小样本下,估计是一致的,但在小样本下,IV 估计并非无偏估计量,有些情况下偏误可能很严估计并非无偏估计量,有些情况下偏误可能很严重。重。弱工具变量检验弱工具变量检验工具变量工具变量Z与与 X 的相关性较低时,的相关性较低时,2SLS 估计估计量存在偏误,量存在偏误,Z 称为称为“弱工具变量弱工具变量”。检验方法:检验方法: estat firststage 1。

43、初步判断可以用偏。初步判断可以用偏R2(partial R2) (剔除掉模型中原有外生变量的影响剔除掉模型中原有外生变量的影响)。 2。 Minimum eigenvalue statistic(最小最小特征值统计量特征值统计量),经验上此数应该大于,经验上此数应该大于10。 这个方法类似于与书上的这个方法类似于与书上的“第一阶段第一阶段F统计量统计量” (但允许有多个内生变量)(但允许有多个内生变量) 。工具变量外生性检验工具变量外生性检验我们一般称为我们一般称为过度识别约束过度识别约束J检验。检验。 检验工具变量是否与干扰项相关,即工具变量是否为检验工具变量是否与干扰项相关,即工具变量是否

44、为外生变量。目前仅限于在过度识别的情况下,在此进外生变量。目前仅限于在过度识别的情况下,在此进行过度识别检验。行过度识别检验。TSLS根据根据Sargan统计量进行过度识别检验统计量进行过度识别检验 。命令为:命令为: estat overid 检验工具变量的外生性。检验工具变量的外生性。 H0:所有工具变量都是外生的。:所有工具变量都是外生的。 H1:至少有一个工具变量不是外生的,与扰动项相:至少有一个工具变量不是外生的,与扰动项相关。关。 ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first estat fi

45、rststage estat overid 究竟该用究竟该用OLS 还是还是IV还有一个重要问题没有考虑:我们只是假设还有一个重要问题没有考虑:我们只是假设解释变量中具有内生性。那么解释变量是否解释变量中具有内生性。那么解释变量是否真的存在内生性?真的存在内生性?假设能够找到方程外的工具变量。假设能够找到方程外的工具变量。1。如果所有解释变量都是外生变量,则。如果所有解释变量都是外生变量,则OLS 比比IV 更有效。在这种情况下使用更有效。在这种情况下使用IV,虽然估,虽然估计量仍然是一致的,会增大估计量的方差。计量仍然是一致的,会增大估计量的方差。2。如果存在内生解释变量,则如果存在内生解释

46、变量,则OLS 是不一致的,是不一致的,而而IV 是一致的。是一致的。检验方法:豪斯曼检验检验检验方法:豪斯曼检验检验豪斯曼检验(豪斯曼检验(Hausman specification test)H0 :所有解释变量均为外生变量。:所有解释变量均为外生变量。H1:至少有一个解释变量为内生变量。:至少有一个解释变量为内生变量。 quietly reg lw80 s80 expr80 tenure80 iq est store ols quietly ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age) est store iv

47、hausman iv ols在香烟需求中的应用在香烟需求中的应用在香烟的案例中我们增加了两个工具变量:销在香烟的案例中我们增加了两个工具变量:销售税与香烟专项税。我们现在判定这两个工具售税与香烟专项税。我们现在判定这两个工具变量的变量的外生性外生性。我们发现:香烟专项税可能不具有外生性,例我们发现:香烟专项税可能不具有外生性,例如,种植烟草的州的吸烟率要高于大多数其他如,种植烟草的州的吸烟率要高于大多数其他州的吸烟率。而这个因素与税收相关,原因是州的吸烟率。而这个因素与税收相关,原因是如果烟草种植和香烟生产是这个州的重要产业,如果烟草种植和香烟生产是这个州的重要产业,那么这些企业会努力让香烟专

48、项税维持在低水那么这些企业会努力让香烟专项税维持在低水平上,所以,这个州是否种植烟草和生产香烟,平上,所以,这个州是否种植烟草和生产香烟,它可能与香烟专项税相关。它可能与香烟专项税相关。1. 由于这是一份面板数据,所以我们可以利由于这是一份面板数据,所以我们可以利用离差的形式消除这种不随时间变化的内生变用离差的形式消除这种不随时间变化的内生变量的影响。量的影响。2. 两个不同年份间的时间跨度会影响弹性估两个不同年份间的时间跨度会影响弹性估计的解释。这是因为香烟是能让人上瘾的,所计的解释。这是因为香烟是能让人上瘾的,所以只有在较长的时间范围,价格的改变才会改以只有在较长的时间范围,价格的改变才会

49、改变吸烟者的习惯。即对于香烟来说,短期内的变吸烟者的习惯。即对于香烟来说,短期内的需求可能没有弹性,但长期内可能富有弹性。需求可能没有弹性,但长期内可能富有弹性。3. 因此,我们把时间差定为因此,我们把时间差定为10年。年。被解释变量被解释变量内生解释变量内生解释变量外生解释变量外生解释变量工具变量工具变量1工具变量工具变量2获得工具变量的方法获得工具变量的方法使用工具变量法的前提是存在有效的工具变使用工具变量法的前提是存在有效的工具变量。因此,如果寻找工具变量在实践中十分量。因此,如果寻找工具变量在实践中十分重要。由于工具变量的两个要求(重要。由于工具变量的两个要求(“相关性相关性”与与“外

50、生性外生性”)常常是自相矛盾的,即与)常常是自相矛盾的,即与内生解释变量相关的变量常常与被解释变量内生解释变量相关的变量常常与被解释变量的扰动项也相关。故在实践上寻找合适的工的扰动项也相关。故在实践上寻找合适的工具变量常常比较困难,有时需要一定的创造具变量常常比较困难,有时需要一定的创造性与想象力。性与想象力。第一种方法是利用经济理论提出工具变量。例第一种方法是利用经济理论提出工具变量。例如如,Philip Wright对农业市场经济的了解促使对农业市场经济的了解促使他找寻使供给曲线移动但需求曲线不动的工具他找寻使供给曲线移动但需求曲线不动的工具变量,于是他找到了天气。变量,于是他找到了天气。

51、 第二种构造工具变量的方法是找出实际上是由第二种构造工具变量的方法是找出实际上是由导致内生回归变量移动的随机现象引起的内生导致内生回归变量移动的随机现象引起的内生回归变量回归变量X变化的某个外生因素。例如,在上变化的某个外生因素。例如,在上面的假想例子中,地震造成的损害使某些学区面的假想例子中,地震造成的损害使某些学区的平均班级规校增大了,显然班级规模的这种的平均班级规校增大了,显然班级规模的这种变动与影响学生成绩的潜在遗漏变量不相关。变动与影响学生成绩的潜在遗漏变量不相关。在实际操作中:在实际操作中:寻找工具变量的步骤大致可以分为两步,寻找工具变量的步骤大致可以分为两步,(i)列出与内生解释

52、变量()列出与内生解释变量(X)相关的尽可)相关的尽可能多的变量的清单(这一步较容易);能多的变量的清单(这一步较容易);(ii)从这一清单中剔除与扰动项相关的变)从这一清单中剔除与扰动项相关的变量(这一步较难)。量(这一步较难)。寻找工具变量的几个实例寻找工具变量的几个实例例一。把罪犯关进监狱会减少犯罪吗?例一。把罪犯关进监狱会减少犯罪吗?要考察的问题:入狱人口增加要考察的问题:入狱人口增加1%引起的犯罪引起的犯罪率的变化。率的变化。估计这个效应的一种方法是利用美国的州的年估计这个效应的一种方法是利用美国的州的年度数据建立犯罪率对监禁率的回归。此外,该度数据建立犯罪率对监禁率的回归。此外,该

53、回归中应该包含一些衡量经济环境的控制变量,回归中应该包含一些衡量经济环境的控制变量,人口统计变量等等。人口统计变量等等。遗漏变量偏差问题:遗漏变量偏差问题:双向因果偏差:一方面,被监禁的人增多使犯双向因果偏差:一方面,被监禁的人增多使犯罪率下降;但另一方面,犯罪率上升会有更多罪率下降;但另一方面,犯罪率上升会有更多的人被监禁。的人被监禁。因此,我们必须选择工具变量,这个工具变量因此,我们必须选择工具变量,这个工具变量必须与监禁率相关必须与监禁率相关(它必须是相关的它必须是相关的),同时也,同时也必须与感兴趣犯罪率方程中的误差项无关必须与感兴趣犯罪率方程中的误差项无关(它它必须是外生的必须是外生

54、的)。Levitt(1996)寻找了以下工具变量:寻找了以下工具变量:监狱容量,即减少监狱过分拥挤的诉讼。监狱容量,即减少监狱过分拥挤的诉讼。1。监狱过度拥挤诉讼减慢了数据中囚犯监。监狱过度拥挤诉讼减慢了数据中囚犯监禁的发展速度,这表明这个工具变量是相关禁的发展速度,这表明这个工具变量是相关的。的。2。监狱过度拥挤诉讼是由监狱条件而不是。监狱过度拥挤诉讼是由监狱条件而不是由犯罪率或其决定因素导致的程度,我们得由犯罪率或其决定因素导致的程度,我们得出这个工具变量是外生的。出这个工具变量是外生的。例二。缩小班级规模能提高测试成绩吗例二。缩小班级规模能提高测试成绩吗?第二篇我们看到了,小班的学校往往

55、比较富有,第二篇我们看到了,小班的学校往往比较富有,并且他们的学生也能获得更多的校内和校外学并且他们的学生也能获得更多的校内和校外学习机会,所以当时我们控制了各种度量学习机会,所以当时我们控制了各种度量学生富裕状况和英语学习能力等的变量,利用多生富裕状况和英语学习能力等的变量,利用多元回归解决了遗漏变量偏差的威胁。元回归解决了遗漏变量偏差的威胁。遗漏变量偏差:但还有可能遗漏掉其他无法获遗漏变量偏差:但还有可能遗漏掉其他无法获得的变量,如校外的学习机会等。得的变量,如校外的学习机会等。因此我们需要找到一个工具变量,这个变量因此我们需要找到一个工具变量,这个变量与班级规模相关与班级规模相关(相关性

56、相关性),但与组成误差项的,但与组成误差项的因素因素(如父母对学习的兴趣、课外的学习机会、如父母对学习的兴趣、课外的学习机会、教师的质量和学校设施教师的质量和学校设施)等不相关等不相关(外生性外生性)。Hoxby(2000)找到的工具变量:找到的工具变量:出生日期导致的潜在入学人数距离其长期趋出生日期导致的潜在入学人数距离其长期趋势的偏差势的偏差1。这一变量与班级规模相关。这一变量与班级规模相关。2。这一变量与随机误差项不相关。这一变量与随机误差项不相关。例三。对心脏病的积极治疗能延长寿命吗?例三。对心脏病的积极治疗能延长寿命吗?模型的设置:被解释变量是患者期望寿命,解释变模型的设置:被解释变

57、量是患者期望寿命,解释变量包括二元治疗变量量包括二元治疗变量(患者是否接受了心导管术患者是否接受了心导管术) 和和其他影响死亡率的控制变量其他影响死亡率的控制变量(年龄、体重、其他健康年龄、体重、其他健康状况指标等等状况指标等等)。变量内生性问题:所有决定接受治疗的人都是被认变量内生性问题:所有决定接受治疗的人都是被认为治疗有效的人,如果他们的决定部分取决于数据为治疗有效的人,如果他们的决定部分取决于数据集中没有包含的但与健康结果有关的不可观测因素,集中没有包含的但与健康结果有关的不可观测因素,则治疗决定与回归误差项相关。则治疗决定与回归误差项相关。McClellan,McNeil和和Newh

58、ouse(1994)找找到的工具变量:到的工具变量:地理位置。地理位置。大部分医院都不是专攻心导管术的。因此许多大部分医院都不是专攻心导管术的。因此许多患者到没有提供这种治疗的患者到没有提供这种治疗的“普通普通”医院的距医院的距离比到心导管术医院的距离近。离比到心导管术医院的距离近。所以可以把患所以可以把患者的家到最近的心导管术医院的距离和到最近者的家到最近的心导管术医院的距离和到最近的任何类型医院的距离之差作为工具变量的任何类型医院的距离之差作为工具变量,若,若距离最近的医院为心导管术医院,则距离之差距离最近的医院为心导管术医院,则距离之差为零,否则取正。如果这个相对距离影响到患为零,否则取

59、正。如果这个相对距离影响到患者接受这种治疗的概率则它是相关的。同时它者接受这种治疗的概率则它是相关的。同时它在在患者间是随机分配的,因此它是外生的。患者间是随机分配的,因此它是外生的。例四:警力与犯罪率。例四:警力与犯罪率。一般认为,警察人数越多,执法力度越大,一般认为,警察人数越多,执法力度越大,则犯罪率应该越低。为了度量警力对犯罪则犯罪率应该越低。为了度量警力对犯罪率的作用,如果直接把犯罪率对警察人数率的作用,如果直接把犯罪率对警察人数进行回归,就会出现进行回归,就会出现“内生变量偏差内生变量偏差”。这是因为,警察人数其实是一个内生变量,这是因为,警察人数其实是一个内生变量,比如,某个城市

60、的犯罪率很高,则市政府比如,某个城市的犯罪率很高,则市政府通常会扩大警力规模。(双向因果关系)通常会扩大警力规模。(双向因果关系)为此,必须找到与警察人数相关,但对为此,必须找到与警察人数相关,但对犯罪率却没有单独影响的工具变量。犯罪率却没有单独影响的工具变量。Levitt (1997)创造性地使用创造性地使用“市长选举市长选举的政治周期的政治周期”作为工具变量。通常,在作为工具变量。通常,在任市长在竞选连任时,为了拉选票,会任市长在竞选连任时,为了拉选票,会增加警察人数,故满足增加警察人数,故满足“相关性相关性”。另。另一方面,选举周期一般以机械的方式确一方面,选举周期一般以机械的方式确定,

61、除了对警察人数有影响外,不会单定,除了对警察人数有影响外,不会单独地对犯罪率起作用,故满足独地对犯罪率起作用,故满足“外生性外生性”。例五:国际贸易与经济增长。例五:国际贸易与经济增长。国际贸易会带来财富是一个古老的观点。但国际贸易会带来财富是一个古老的观点。但要实证地研究国际贸易对经济增长的促进作要实证地研究国际贸易对经济增长的促进作用却面临着内生解释变量的问题,因为经济用却面临着内生解释变量的问题,因为经济增长也可以反作用于国际贸易,即随着经济增长也可以反作用于国际贸易,即随着经济增长,国际贸易也跟着增加了。增长,国际贸易也跟着增加了。Frankel and Romer (1999)使用地

62、理因素作为工使用地理因素作为工具变量。首先,国际贸易受地理因素的影响具变量。首先,国际贸易受地理因素的影响(比如,距离越近的国家贸易量越大),故(比如,距离越近的国家贸易量越大),故满足满足“相关性相关性”。其次,地理因素对经济增。其次,地理因素对经济增长的影响可能仅仅通过国际贸易这个渠道来长的影响可能仅仅通过国际贸易这个渠道来实现,故满足外生性。实现,故满足外生性。例六:制度对经济增长的影响。例六:制度对经济增长的影响。好的制度能促进经济增长,但制度变迁常常好的制度能促进经济增长,但制度变迁常常也依赖于经济增长。因此,制度本身是一个也依赖于经济增长。因此,制度本身是一个内生变量。内生变量。A

63、cemoglu et al(2001)使用使用“殖民者死亡率殖民者死亡率”(settler mortality)作为)作为工具变量。当近代欧洲的殖民者在全世界进工具变量。当近代欧洲的殖民者在全世界进行殖民时,由于各地的气候及疾病环境行殖民时,由于各地的气候及疾病环境(disease environment)不同,欧洲殖民)不同,欧洲殖民者的死亡率十分不同。在死亡率高的地方者的死亡率十分不同。在死亡率高的地方(比如,非洲),殖民者难以长期居住,故(比如,非洲),殖民者难以长期居住,故在当地建立掠夺性的制度(在当地建立掠夺性的制度(extractive institutions)。)。而在死亡率低的地方(比如,北美),而在死亡率低的地方(比如,北美),则建立有利于经济增长的制度(比如,则建立有利于经济增长的制度(比如,较好的产权保护)。这种初始制度上的较好的产权保护)。这种初始制度上的差异一直延续到今天。因此,差异一直延续到今天。因此,“殖民者殖民者死亡率死亡率”与今天的制度相关,满足与今天的制度相关,满足“相相关性关性”。另一方面,。另一方面,“殖民者死亡率殖民者死亡率”除了对制度有影响外,不再对当前的经除了对制度有影响外,不再对当前的经济增长有任何直接影响,故满足济增长有任何直接影响,故满足“外生外生性性”。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号