工具变量在因果推断中应用

资源描述

《工具变量在因果推断中应用》由会员分享，可在线阅读，更多相关《工具变量在因果推断中应用（25页珍藏版）》请在金锄头文库上搜索。

1、*作者感谢康奈尔大学摩根( Stephen Morgan) 教授、牛津大学斯奈德斯( Tom Snijders) 教授和赫斯特罗姆( Peter Hedstrm) 教授、香港科技大学吴晓刚教授、中山大学梁玉成副教授、浙江省社会科学院范晓光助理研究员的讨论、批评和建议，同时感谢匿名评审专家和编辑部提出的修改意见以及 CGSS 2003 和 CHIPS 2002 数据团队。文责自负。圣杯( grail) 系指耶稣受难时用来盛放鲜血的圣餐杯。在凯尔特神话中，追寻圣杯是一个神圣而伟大的主题， “有能者居之” ，其过程则充满艰险，传说有无数骑士为了寻求圣杯而踏上了不归之路

2、。关于社会科学定量分析中的反事实因果框架可参见摩根和温肖普的文章( Morgan Winship， 2007) 。谢宇( 2006) 曾经以大学教育为例来说明反事实因果的含义。比如，在分析大学教育对个体的收入是否有因果效应时，对一个上大学的学生，我们不可能获得他不上大学情况下的数据。因此，社会学定量分析中只能用平均干预效应来替代，也即估算一组大学生( 干预组) 与一组非大学生( 控制组) 之间的平均收入差异。逻辑逻辑、想象和诠释: 工具变量在社会科学因果推断中的应用想象和诠释: 工具变量在社会科学因果推断中的应用 * 陈云松提要: 工具变量( instrument

3、al variable) 是社会科学定量分析中解决内生性问题的重要手段，是基于调查数据进行因果推断的前沿方法。本文在简要介绍工具变量的定义、原理及估算方法的基础上，对实证分析中较为常见的五类工具变量进行回顾梳理，为今后研究寻找工具变量提供了参考。同时，对工具变量估计量的权重性特征进行了阐述，并结合实例展示了使用工具变量进行因果推断的基本步骤和要点。最后，就工具变量方法的潜力和局限性进行了剖析。关键词: 工具变量内生性定量分析因果推断一一、导言: 因果推断的圣杯导言: 因果推断的圣杯在反事实因果的框架之下，基于调查数据的社会学定量分析要进行因果推断，难度极大

4、。其主要原因在于，社会学家一旦要证明某个他们所感兴趣的 “因” 会带来一定的“果” ，就必须面对一个永恒挑战: “内生性” 问题( endogeneity) 。也即: 如果某个潜在的、无法观测的干 291 扰项，既影响 “因” ，又影响 “果” ，那么，利用最小二乘法模型( 简称 OLS 模型) 进行回归分析所得到的估计量就会是有偏误的，而不具有因果推断力。在实证分析中，无论是经典的教育回报研究( Card， 1999) ，还是我国学界非常关注的关系网、社会资本研究( Mouw， 2003， 2006; 陈云松、范晓光， 2010， 2011) ，内生性问题都

5、极为重要且亟待解决。解决内生性问题的常见方法，主要包括工具变量( instrumental var- iable，简称 IV) 、固定效应模型( fixed effects model，简称 FE) 、倾向值匹配( propensity score matching，简称 PSM) 、实验以及准实验( experiments and quasi- experiments) 等等。近年来，其中不少方法已经逐步在我国社会学界得到评述和应用( 梁玉成， 2010; 陈云松、范晓光， 2010， 2011; 陈云松， 2012; 胡安宁， 2012; 魏万青， 2012) 。

6、在反事实因果分析框架下，实验或准实验方法最切近要义。但社会科学的很多研究主题和领域决定了无法使用实验方法，而其他方法也都具有较大的局限性。如固定效应模型只能消除时间固定的干扰项，倾向值匹配方法则完全依赖于 “可观测因素被忽略” 的假说。相比较而言，对基于调查数据的定量分析，工具变量方法具有独特优势。不过，工具变量方法在社会学分析中的运用，目前却远远不如它在计量经济学和政治学定量分析中那么广受青睐( 政治学和计量经济学研究中工具变量方法的使用参见 Sovey Green， 2011; Angrist et al ， 1996; Angrist Krueger， 20

7、01) 。但是，近 10 年来社会学界对于工具变量的态度，正在由不熟悉、犹豫不决向着逐步接纳而转型。10 年前，康奈尔大学的摩根有感于工具变量方法得不到社会学家青睐而专门写成一篇社会学家该不该用工具变量的文章( Morgan，2002) 。整整 10 年后，美国社会学年鉴 ( Annual Review of Sociology) 专门刊出了博伦关于工具变量在社会学分析中应用的综述( Bollen，2012) 。这篇重要论文从技术角度详细回顾了 2000 2009 年间在美国三大顶级社会学刊物( American Sociological Review， America

8、n Journal of Sociology，以及 Social Forces) 刊发的 57 篇采用工具变量方法的论文。毫无疑问，工具变量方法逐步被社会学界关注和接纳的过程，充分展示了社会学定量分析方法的演进以及与其他 391 论文逻辑逻辑、想象和诠释: 工具变量在社会科学因果推断中的应用想象和诠释: 工具变量在社会科学因果推断中的应用在社会资本和社会网研究中对内生性问题关注最早的仍是计量经济学界( 参见 Manski， 1993， 2000; Moffitt， 2001;Durlauf，2002;Durlauf Fafchamps，2004;Bramoull et al ，

9、2007) 。学科在方法论上的进一步融合。那么，何以说工具变量是定量分析中因果推断的“圣杯” ?这是因为，好的工具变量非常难以寻觅，寻找它的逻辑和数据挖掘过程充满艰辛、难以驾驭，甚至往往需要研究者的灵感。但它在模型上的简洁性，它对社会科学想象力、逻辑力和诠释力的要求，既为定量分析提供了因果推断的重要武器，也让分析的过程充满趣味和奇思妙想。本文将以尽量浅显的语言，总结回顾工具变量的原理、来源、分类和特性，并结合具体分析案例，勾勒工具变量方法的实施步骤和诠释要点。本文是当前社会学文献中首次对工具变量进行梳理和分类的尝试，也是目前我国社会学定量分析领域

10、第一次对工具变量的全面介绍、评述和案例展示。二二、工具变量的原理: 模型之外的力量工具变量的原理: 模型之外的力量工具变量的原理最早由菲利普莱特( Philip G Wright) 在上世纪 20 年代末提出( Stock Trebbi， 2003) ，这里仅作扼要介绍和基本的模型推演。首先，我们给出一个典型的线性回归模型: y = 0+ 1x1+ X + ( 1) 这里 y 为因变量，也即“果” ; x1为自变量，或者解释变量，也即 “因” 。大写的 X 为外生控制项向量( 也即一组假定为外生的其他控制变量，例如年龄、性别等等) ，则为误差项。如果与 x1不相关

11、，那么我们可以利用 OLS 模型对方程进行无偏估计。然而，如果一个重要变量 x2被模型( 1) 遗漏了，且 x 1和 x2也相关，那么对 1的 OLS 估计值就必然是有偏的。此时， x1被称作“内生” 的解释变量，这也就是著名的 “内生性” 问题。要解决这一内生性问题，我们需要引入更多信息来进行无偏估计。工具变量的方法就是引入一个外生变量 Z，且 Z 必须满足以下两个条件: 与不相关，但与 x1相关。或者说， Z 仅仅通过影响 x1来影响 y。这样，根据工具变量的必备条件，我们可以得到: Cov( Z， x1) 0;Cov( Z，)= 0( 2) 由方程(

12、 1) 我们可以推导出: Cov( Z， y)= 1Cov( Z，x1)+ Cov( Z， X)+ Cov( Z，) 。再根据方程( 2) 和 X 是外生向量的假设，我们得到 Cov( Z， y) 491 社会学研究2012 6 = 1Cov ( Z， x1) ，也即: 1= Cov( Z， y) /Cov( Z，x1) 故此，我们可以对 1进行无偏估计: 1 = n i =1( Zi 珔Z) ( yi珋y) n i =1( Zi 珔Z) ( x1i x1) ( 3) 方程( 3) 里的1，也就是工具变量估计量。如果用上述公式还不能直观清晰地表达工具变量的原理，那么我们可以用下

13、面的示意图来做一简要说明。在图 1 中，模型的范围用虚线框来表示。工具变量 Z 处于模型之外( 也即在虚线框之外) ，因此是完全外生的。此时，工具变量 Z 只能通过影响自变量 x1而间接影响因变量 y。如果工具变量 Z 和自变量 x1密切相关，那么，只要工具变量 Z 有了增量变化，就必然会对自变量 x1产生一个来自模型之外的冲击。如果自变量 x1和因变量 y 之间真的存在因果关系，那么 Z 对 x1 带来的冲击也就势必传递到 y。这样，在一系列的假说之下，只要 Z 对 y 的间接冲击能够被统计证明是显著的，我们就可以推断出 x1对 y 必然有因果关系。利用对

14、Z 与 x1相关的估算，以及 Z 与 y 的间接相关的估算，理论上我们就可以推导出 x1和 y 之间真实关系的大小 1。因此，图 1 非常清晰地展示了工具变量的原理: 利用来自模型之外的外生差异进行无偏估计。较为常见的工具变量估算方法是两阶段最小二乘法( two- stage least- squares，也即 2SLS) 。在回归的第一阶段，内生的因变量 x1放在模型左侧，而右侧则为原模型中全部 X 以及工具变量 Z。然后对每一个 x1进行预测赋值。在第二阶段，模型左侧是因变量 y，右侧则为 X 和 x1的第一阶段预测值。工具变量估计量肯定是一致的( 参数估计的

15、一致性指当样本容量趋向无穷大时，参数估计趋近于参数真值，也就是收敛于参数真值) 。不过其估计方差也比相应的 OLS 估计方差要大。工具变量 Z 和自变量 x1之间的关系越紧密，则估计方差越小。要确保工具变量分析结果稳健可信，我们必须首先检验工具变量的合法性，同时还要观察工具变量模型和一般的单方程模型( 如 OLS 或 Probit 模型) 之间的分析结果有无系统差异。这里，有几个至关重要 591 论文逻辑逻辑、想象和诠释: 工具变量在社会科学因果推断中的应用想象和诠释: 工具变量在社会科学因果推断中的应用当然，模型内的干扰项和主解释变量以及因变量之间的关系也可能是逆向

16、的。图 1模型之外的力量: 工具变量原理的统计量的判别是必不可少的。( 1) Z 和 x1必须是强相关。否则，就会带来弱工具变量问题，导致估计量有偏。在使用二阶段估计法时 ( 2SLS) ，一般我们可以依赖 F 统计量来判断两者之间的关系强弱。一般而言，如果 F 统计量大于经验值 10，则不存在弱工具变量问题( Stock Yogo， 2005) 。( 2) 工具变量的外生性是无法用统计方法直接验证的。不过当我们同时使用多个工具变量时( 也即模型被过度识别时 overidentified) ，则可以进行沙根检验( Sargan Test) ; 此外，有一些研究会把工具变量直接加入主模型进行偏系数的显著性检验，不过严格意义上这一做法并不具有有效性。( 3) 豪斯曼内生性检验( Hausman Test of Endogeneity) ，用以检测 OLS 模型和工具变量模型之间是否存在系统差异。如果有，则应

展开阅读全文