第十三讲 工具变量回归

上传人:飞*** 文档编号:54335244 上传时间:2018-09-11 格式:PPT 页数:92 大小:2.48MB
返回 下载 相关 举报
第十三讲 工具变量回归_第1页
第1页 / 共92页
第十三讲 工具变量回归_第2页
第2页 / 共92页
第十三讲 工具变量回归_第3页
第3页 / 共92页
第十三讲 工具变量回归_第4页
第4页 / 共92页
第十三讲 工具变量回归_第5页
第5页 / 共92页
点击查看更多>>
资源描述

《第十三讲 工具变量回归》由会员分享,可在线阅读,更多相关《第十三讲 工具变量回归(92页珍藏版)》请在金锄头文库上搜索。

1、工具变量回归,经典假设4 所有的解释变量Xi与随机误差项彼此之间不相关。,若解释变量Xi和ui相关,则OLS估计量是非一致的,也就是即使当样本容量很大时,OLS估计量也不会接近回归系数的真值。,造成误差项与回归变量相关(内生性)的原因很多,但我们主要考虑如下几个方面:遗漏变量变量变量有测量误差双向因果关系。,遗漏变量偏差可采用在多元回归中加入遗漏变量的方法加以解决,但前提是只有当你有遗漏变量数据时上述方法才可行。 双向因果关系偏差是指如果有时因果关系是从X到Y又从Y到X时,此时仅用多元回归无法消除这一偏差。同样, 变量有测量误差也无法用我们前面学过的方法解决。 因此我们就必须寻找一种新的方法。

2、,工具变量(instrumental variable, IV)回归是当回归变量X与误差项u相关时获得总体回归方程未知系数一致估计量的一般方法。我们经常称其为IV估计。 其基本思想是:假设方程是:,我们假设ui与Xi相关,则OLS估计量一定是有偏的和非一致的。工具变量估计是利用另一个“工具”变量Z将Xi分离成与ui相关和不相关的两部分。,在经济学中: (1)内生变量:由模型内的变量所决定的变量称作内生变量。 (2)外生变量:由模型外的变量所决定的变量称作外生变量。,重要概念:内生变量和外生变量,在计量经济学中,把所有与扰动项相关的解释变量都称为“内生变量”。这与一般经济学理论中的定义有所不同。

3、 1。与误差项相关的变量称为内生变量(endogenous variable)。 2。与误差项不相关的变量称为外生变量(exogenous variable)。,我们的工作就是要寻找相应的工具变量将解释变量分解成内生变量和外生变量,然后利用两阶段最小二乘法(TSLS)进行估计。 一个例子:考虑货币政策对宏观经济的影响。由于货币政策的制定者会根据宏观经济的运行情况来调整货币政策,故货币政策是个内生变量(双向因果关系)。Romer (2004)通过阅读历史文献将货币政策的变动分解为“内生”(对经济的反应)与“外生”(货币当局的自主调整)的两部分。,工具变量的选取,一个有效的工具变量必须满足称为工具

4、变量相关性和工具变量外生性两个条件:即,(1)工具变量相关性:工具变量与所替代的随机解释变量高度相关;(2)工具变量外生性:工具变量与随机误差项不相关;,两阶段最小二乘估计量,若工具变量Z满足工具变量相关性和外生性的条件,则可用称为两阶段最小二乘(TSLS)的IV估计量估计系数1。 两阶段最小二乘估计量分两阶段计算: 第一阶段把X分解成两部分:即与回归误差项相关的一部分以及与误差项无关的一部分。 第二阶段是利用与误差项无关的那部分进行估计。,具体来说: 第一阶段:将X分解成与X高度相关的外生变量Z以及与干扰项ui相关的部分vi。,工具变量回归,谁开创了工具变量回归? 1928年的著作的“The

5、 Tariff on Animal and Vegetable Oils”的附录B。 作者是谁? Philip Wright 还是他的儿子 Sewall Wright 文体计量学的分析,为什么IV回归是有效的?,例1: Philip Wright的问题 Philip Wright关心的是那个时期的一个重要经济问题:即如何对诸如黄油,大豆油这样的动植物油和食用动物设置进口关税。在20世纪20年代,进口关税是美国主要的税收收入来源。而理解关税的经济效应的关键在于要有商品需求和供给曲线的定量估计。由前知供给弹性为价格上涨1%引起的供给量变化的百分率,而需求弹性为价格上涨1%引起的需求量的百分率变化。

6、,例如具休考虑黄油的需求弹性估计问题:,根据11个均衡样本点估计的方程究竟是需求函数还是供给函数?两者都不是。由于这些点是由需求和供给两者的变化确定的,因此用OLS拟合这些点的直线既不是需求曲线也不是供给曲线的估计。,利用这些样本点估计出来的OLS拟合线是需求曲线还是供给曲线,都不是!两个极端的情况如图:,因此,由于这些点是由需求和供给两者的变化确定的,因此用OLS拟合这些点的直线既不是需求曲线也不是供给曲线的估计。,Wright的解决办法: 1。找到第三个变量,这个变量影响供给但不影响需求。这样,所有的均衡价格和均衡量对都落在这条稳定的需求曲线上,此时很容易估计出它的斜率。 2。可见,这第三

7、个变量,也就是工具变量,它与价格相关(它使供给曲线移动,于是导致价格发生变化),但与u无关(需求曲线保持不变)。,3。Wright考虑了几个可能的工具变量;其中一个是天气。例如,某牧场的降雨量低于平均值会使牧草减少从而减少给定价格时黄油的产量(会使供给曲线向左移动而使均衡价格上升),因此牧场地区降雨量满足工具变量相关性的条件。但牧场地区降雨量对黄油的需求没有直接影响,因此牧场地区降雨量与ui的相关系数为零;也就是牧场地区降雨量满足工具变量外生性条件。,上图表明若某个变量使供给曲线移动而使需求保待不变时会发生什么样的情况。现在所有的均衡价格和均衡量对都落在这条稳定的需求曲线,例2:班级模型对测试

8、成缓的效应估计,尽管控制了学生和地区特征,但由于受诸如校外学习机会或教师质量等不可测变量的影响,第二篇中给出的班级规模对测试成绩的效应估计中仍然可能存在着遗漏变量偏差。若这些变量的数据不可得,则不能通过在多元回归中加入这些变量的方法来处理遗漏变量偏差。,工具变量回归提供了解决这一问题的一种思路。考虑下面的假想例子:由于夏天发生了地震,为了进行灾后修复工作,必须关闭某些加利福尼亚州的学校。而最靠近震中的地区受到的影响最严重。于是有学校关闭的地区需要把学生“挤在一起”,因此暂时扩大了班级规模。,这意味着到震中的距离与班级规模相关,故它满足工具变最相关性的条件但如果到震中的距离与其他影响学生成绩的因

9、素无关(如学生是否还在学习英语),则由于它与误差项无关因此是外生的。于是到震中的距离这个工具变量可以用来避免遗漏变量偏差和估计班级规模对测试成绩的效应。,TSLS估计量的抽样分布,为了简单起见,我们仅考虑只有一个回归变量X和一个工具变量Z的情况。,即,参数的TSLS估计量为Z和Y的样本协方差与Z和X的样本协方差之比。,假设原方程为:,即总体系数为Z和Y的总体协方差与Z和X的总体协方差之比。,在香烟需求中的应用,为了减少由于吸烟导致的疾病和死亡,以及这些生病的人对社会其他成员产生的成本或外部性,一种方法是对香烟征收重税从而减少吸烟同时阻止潜在的新吸烟者。但具体需要增加多大幅度的税收来削减香烟的消

10、费呢?例如,若要使香烟消费减少20%则香烟的税后售价应该是多少?,若需求弹性为-1,使价格上涨20%就能达到减少20%消费量的目标。若弹性为-0.5,则价格必须上涨40%才能使消费下降20%。同philip Wright对黄油的研究一样。我们无法通过数量对数关于价格对数的OLS回归得到香烟需求弹性的一致估计。我们利用TSLS和1985-1995年美国48个大陆州的年度数据估计了香烟的需求弹性。,模型假定: 被解释变量:香烟消费,即为州内每人购买的香烟包数。内生解释变量:包含所有税收的每包香烟的实际平均价格。工具变量:由一般销售税征收的香烟税收。,这个工具变量设定是否合理? 工具变量的相关性:由

11、于高销售税增加了总的销售价格 ,因此每包香烟的销售税满足工具变量相关性的条件。 工具变量的外生性:若销售税是外生的,则必须与需求方程中的误差无关;即销售税必然只是通过价格间接影响香烟的需求。这看上去是合理的:主要是因为不同州选择了不同的销售额、收入、财产和其他公共财政事业的混合税收,所以不同州的一般销售税是不同的。其中关于公共财政的选择受到政治考量的驱使而不是受香烟需求有关的因素影响。,结论:这种工具变量的设置方法是合理的。 因此我们利用两阶段最小二乘法(TSLS): 第一阶段结果:第二阶段结果:,一般IV回归模型,因变量 Yi。 外生解释变量 Wi。 内生解释变量 Xi。 我们引入的工具变量

12、Zi。,更为详细的说明,引入工具变量的个数,假设我们有n个内生解释变量,引入了m个工具变量,n和m的关系是什么? n=m 恰好识别 nm 不可识别 只有恰好识别和过度识别才能用IV方法估计。,一般IV模型的TSLS,对一般的IV回归模型,我们需要修改工具变量的相关性和外生性条件。 相关性条件: 1. 当包含一个内生变量但有多个工具变量时,工具变量相关性的条件为给定W时至少有一个Z对预测X是有用的(相关的)。 2. 当包含多个内生变量时,不但要排除完全多重共线性问题,而且工具变量必须提供关于这些变量外生性变动的足够信息,以分离出它们各自对Y的效应。 外生性条件: 工具变量外生性条件的一般叙述为每

13、个工具变量必须与误差项ui不相关。,一般IV模型中的工具变量相关性和外生性,IV回归假设和TSLS估计量的抽样分布,基于TSLS估计量的推断,在香烟需求中的应用,在上一节中,我们基于1995年美国48个州的年消费数据利用包含一个回归变量(每包香烟的实际价格对数)和一个工具变量(每包香烟的实际销售税)的TSLS估计了香烟的需求弹性。 但这个估计并非没有问题的。 收入会影响需求,它是总体回归误差的一部分。若州销售税与州的收入有关,则它与香烟需求方程误差项中的某个变量相关。这违反了工具变量外生性的条件。会导致IV估计量是非一致的。因此我们需要在回归中加入收入这一变量。,除了工具变量SaleTaxi外

14、,我们增加一个新的工具变量香烟专项税CigTaxi,香烟专项税提高了消费者支付的香烟价格,因此可证明它满足工具变量相关性的条件。同时它与州香烟需求方程中的误差项不相关,因此它是外生工具变量。,有了这个工具变量后我们就有了每包香烟的实际销售税和每包香烟的实际州专项税两个工具变量。因此需求弹性是过度识别的,即工具变量的个数(m=2)大于包含的内生变量个数(k=1)。 现在我们就可以利用TSLS估计需求弹性了,其中第一阶段回归中的回归变量为包含的外生变帚ln(Inci)和两个工具变量。,结果,使得标准误差变小。,工具变量有效性的检验,假设1:工具变量相关性 工具变量相关性越强,也就是工具变量能解释越

15、多的X变动,则IV回归中能用的信息就越多,因此利用相关性更强的工具变量得到的估计量也更精确。弱工具变量:如果虽然但是,弱工具变量几乎不能解释X的变动。 例子: 在香烟实例中,我们可证明州到香烟生产厂家的距离是一个弱工具变量:虽然远距离提 高了运输成本(因此使供给曲线向内移动,从而使均衡价格上升),但香烟很轻,因此运输成本只占到了香烟价格中的很小部分。故价格变动量中由运输成本也就是到生产厂家的距离解释的部分可能非常小。,为什么弱工具变量是个问题,如果工具变量是弱的,那么即使当样本容量较大时用正态分布近似TSLS估计量的抽样分布效果仍然很差。因此即便是在大样本下仍然缺乏常用统计推断方法的理论依据。

16、事实上,如果工具变量较弱,则TSLS估计量严重偏离OLS估计量的方向。此外,用TSLS估计量1.96标准误差构造的95%置信区问包含系数真值的次数远小于95%,简言之,若工具变量较弱则TSLS不再是可靠的了。,弱工具变量会使得分母变得很小,甚至为0,导致结果严重偏离。,一个内生回归变最时弱工具变量的检验,当只有一个内生回归变量时检验弱工具变量的一种方法是利用F统计量检验TSLS第一阶段回归中工具变量系数都为零的假设。 第一阶段F统计量,度量了工具变量中包含的信息:包含的信息越多,则F统计量的期望值越大。经验法则是如果第一阶段F统计量应该超过10。,即检验Z1、 Z2 、Zm的联合显著性。 test Z1=Z2=Zm=0 计算F值 然后和10比较。,如果存在弱工具变量该怎么办?,1. 如果有很多工具变量,有少数强工具变量和许多弱工具变量,可以忽略最弱的工具变量而选用相关性最强的工具变量子集。 2. 但如果系数是恰好识别的,则你不能略去弱工具变量。即使系数是过度识别的,但你可能没有足够的强工具变量用于识别,因此略去一些弱工具变量也没有什么帮助。在这种情况下,有两个选择:,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号