双重差分法的平行趋势假定双重差分法是估计处理效应的常见方法,但也有被滥用的倾向,因为有些应用者对于双重差分法的优 点与局限缺乏了解,特别是其潜在的平行趋势(parallel trend)假定……差分法的局限经济学家常关心某政策实施后的效应,比如对于收入( y )的作用最简单(天真)的做法是比较处 理组(即受政策影响的地区或个体)的前后差异,比如这称为"差分估计量”(difference estimator),即将处理组(treatment group)政策实施后的样本均值, 减去政策实施前的样本均值然而,由于宏观经济环境也随时间而变(时间效应),故政策实施地区的前 后差异未必就是处理效应( treatment effects)双重差分法的反事实逻辑为了解决差分法的局限性,常用方法是寻找适当的控制组(control group),即未实施政策的地区(或 未参加项目的个体),作为处理组的反事实(counterfactual)参照系具体来说,可将未受政策影响的控 制组之前后变化视为纯粹的时间效应,即综合以上两个差分,即将处理组的前后变化减去控制组的前后变化,可得到对于政策处理效应更为可靠的估计:这就是所谓的双重差分估计量(Difference in Differences,简记DD或DID),因为它是处理组差分与控制组差分之差。
该法最早由Ashenfelter (1978)弓|入经济学,而国内最早的应用或为周黎安、陈烨 ( 2005 )从以上推理可知, DID 的反事实逻辑能够成立,其基本前提是,处理组如果未受到政策干预,其时间 效应或趋势应与控制组一样(故可以后者来控制时间效应),这就是所谓的 “平行趋势”( parallel trend) 或 哄同趋势"(common trend)假定下图直观地展示了 DID的思想与平行趋势假定2-^cnntral,! «DID其中,t = 1表示政策实施前(before),而t = 2表示政策实施后(after)然而,通过双重差分得 到的 DID 估计量并不易计算其标准误,无法加入控制变量,也不易推广到多期数据故在实践中,一般通 过回归的方法来得到 DID 估计量双重差分法的回归模型考虑以下面板模型:- '7 '' ' ■''' - ' ' ' '' - ■■- --' ⑵其中,Gt为分组虚拟变量(处理组=1,控制组=0),表示处理组与控制组的固有差异(无论是否实施 政策都存在);Dt为分期虚拟变量(政策实施后=1,政策实施前=0,允许使用多期数据),表示政策实施 前后的时间效应(即使不实施政策也存在);而交互项G厂Dt才真正表示处理组在政策实施后的效应, 即处理效应。
这是因为,处理组在政策干预之后的期望值为:Q如= 1. D = 1}=门 +』+ ■: + $而处理组在政策干预之前的期望值为:E(加严 L D = 0) = a + ?故处理组期望值的前后变化为:门」 ■上""' -⑶另一方面,控制组在政策干预之后的期望值为:而控制组在政策干预之前的期望值为:E(加JGi 二 0?D( = 0) = n故控制组期望值的前后变化为:(--■卜f ':.n -⑷将(3)式减去(4)式可知,双重差分的结果正好是回归方程(2)中交互项Gj・Dt之系数0进一步可以证 明,用OLS估计面板模型(2),所得交互项Gj・Dt之系数0的估计值,正好等于双重差分法(1)的计算结 果(陈强, 2014,第 335、339页)一般的双重差分回归 更一般地,可在面板模型中加入个体固定效应、时间固定效应,以及其它控制变量:'■1 - -1' ■' ■ - 'f- - ⑸其中,ui为个体固定效应(取代了更为粗糙的分组虚拟变量G/,若同时二者包括将导致严格多重共 线性),人为时间固定效应(取代了更为粗糙的分期虚拟变量Dt,若同时包括二者将导致严格多重共线 性),zit为一系列控制变量(影响结果变量y的其它因素),而%为暂时性冲击(transitory shock)。
不难看出,上式其实就是"双向固定效应模型"(two-way fixed effects),因为它既包括个体固定效应 (5),也包括时间固定效应(人);只不过多了双重差分法的关键变量,即交互项G厂Dt (也称为“政 策虚拟变量",policy dummy)在具体回归中,个体固定效应q可通过加入个体虚拟变量来实现(即LSDV 法,或进行组内离差变换,within transformation);而时间效应人可通过加入每期的时间虚拟变量(time dummies)来实现双重差分法的假定为了使用OLS —致地估计方程(5),需要作以下两个假定假定1、此模型设定正确特别地,无论处理组还是控制组,其时间趋势项都是人此假定即上文的 “平行趋势假定"(parallel trend assumption)此假定比较隐蔽(有人称为“hidden assumption"),因为 只要写下方程(5),就已默认了平行趋势假定假定2、暂时性冲击弘与政策虚拟变量 G/• Dt不相关这是保证双向固定效应为一致估计量 (consistent estimator)的重要条件在此,可以允许个体固定效应S与政策虚拟变量Gj. Dt相关(可通过双重差分或组内变换消去Uj, 或通过LSDV法控制s )。
DID允许根据个体特征(up进行选择,只要此特征不随时间而变;这是DID 的最大优点,即可以部分地缓解因"选择偏差"(selection bias )而导致的内生性(endogeneity)如果违背假定 1(平行趋势假定),会有什么后果?假设真实模型为:yu —■口 + r 乜沖 + 爲 + 入 + G洞 t + e 砒则处理组(Gt=1)的时间趋势为(人+ nt),而控制组(G/=0)的时间趋势为人,故为非平行趋势如 果将此模型误设为平行趋势,则实际估计的模型为y,; = a + ‘ D( + 丁'z* + 址 + 入f + £舟 + 晦)其中,Gjnt被纳入扰动项中,导致扰动项(Gjnt + %)与政策虚拟变量(G厂Dt )相关,使得OLS 不一致,也违背了上述假定 2阿森费尔特沉降(Ashenfelter's dip在使用个体或企业层面的微观数据时,有些人认为因个体无法影响宏观政策(或培训项目)的推出, 故为外生但事实上,个体依然可以自我选择是否参加项目,从而导致内生性比如, Ashenfelter (1978) 在研究就业培训的效应时发现,参加就业培训者在参加培训之年 (1964) 以 及之前的那年 (1963),其平均收入不仅相对于控制组下降,而且绝对地下降,称为 “阿森费尔特沉降”( Ashenfelter's dip ),参见下图。
在上图中,实线为参加项目者的平均收入,而虚线为未参加项目者的平均收入(二者均为男性白人, 该现象也存在于女性白人、男性黑人、女性黑人,在此从略)上图表明,在1963 年与 1964 年收入下降 的不走运者(%为很大的负向冲击),很多人自我选择参加就业培训如果因为弘或£it-1特别低而参加培训,则通常%+1与%+2会恢复到正常值,导致高估培训项目的 效应而{%}也可能存在自相关这使得暂时性冲击%与政策虚拟变量G厂Dt相关,导致不一致的估 计(也意味着非平行的时间趋势,违背假定 1,参见上图)非平行趋势的检验与处理方法方法一、画时间趋势图 如果在政策干预前有多期数据,则可分别画处理组与控制组的时间趋势图(类似于上图),并直观判断这两组的时间趋势是否平行(比如,考察是否存在Ashenfelter's dip)如果二者大致平行,则可增强对 平行趋势假定的信心然而,即使在政策干预前两组的时间趋势相同,也无法保证二者在干预后的时间趋 势也相同(后者本质上不可观测,因为时间效应已与处理效应混合在一起)另外,如果只有两期数据, 则无法使用此法方法二、加入更多的控制变量从上文的讨论可知,非平行趋势可能由于遗漏变量所导致,故在 zit 中加入更多控制变量,或可缓解 内生性。
但此法在实践中不易实施方法三、假设线性时间趋势如果假设时间趋势为线性函数,则可加入每位个体的时间趋势项:如=a + 0G • + 吋% + 広t + % + 跖在具体回归时,加入个体虚拟变量与时间趋势项 t= 1, 2, ... , T 的交互项即可然而,线性时间趋势 毕竟是较强的假定,不一定能成立故此法也不完全解决问题,但可作为稳健性检验方法四、三重差分法在 一 定 条 件 下 , 可 通 过 引 入 两 个 控 制 组 , 进 行 三 次 差 分 , 称 为 “ 三 重 差 分 法 ” (difference-in-differences-in-differences,简记DDD),这样可以更好地控制时间趋势的差异,使得平行 趋势假定更易成立有关 DDD 的进一步介绍,参见陈强(2014,第 343 页)。