内生性产生的原因及解决方案（精品课件)

资源描述

《内生性产生的原因及解决方案（精品课件)》由会员分享，可在线阅读，更多相关《内生性产生的原因及解决方案（精品课件)（114页珍藏版）》请在金锄头文库上搜索。

1、第五讲内生性,OLS经典假设所有的解释变量Xi与随机误差项彼此之间不相关。,若解释变量Xi和ui相关，则OLS估计量是非一致的，也就是即使当样本容量很大时，OLS估计量也不会接近回归系数的真值。当解释变量和随机误差项相关时，模型存在着内生性问题。,在计量经济学中，把所有与扰动项相关的解释变量都称为“内生变量”。这与一般经济学理论中的定义有所不同。 1。与误差项相关的变量称为内生变量(endogenous variable)。 2。与误差项不相关的变量称为外生变量(exogenous variable)。,造成误差项与回归变量相关（内生性）的原因很多，但我们主要考虑如下几个方面：遗漏变量

2、偏差变量有测量误差双向因果关系。,遗漏变量偏差,变量有测量误差测量数据正确时：假设方程为：,当存在测量误差时：方程为：,所以我们有：,可知，误差项中包含,所以可以得到：如果,则回归结果有偏，非一致,我们假设,则有,结论：1。由于,2。回归的性质决定于w的标准差,双向因果关系之前我们假定因果关系是从回归变量到因变量的(X导致了Y)。但如果因果关系同时也是从因变量到一个或多个回归变量(Y导致了X)的呢？如果是这样的话，因果关系是向前的也是“向后” 的，即存在双向因果关系，如果存在双向因果关系，则OLS回归中同时包含了这两个效应，因此OLS估计量是有偏的、非一致的。,可以推导出：,检验方法：

3、豪斯曼检验检验,豪斯曼检验（Hausman specification test） H0 ：所有解释变量均为外生变量。 H1：至少有一个解释变量为内生变量。 quietly reg lw80 s80 expr80 tenure80 iq est store ols quietly ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age) est store iv hausman iv ols ，若 Hausman 检验失效（检验统计量为负值），则使用dmexogxt，否则仍Hausman检验为主。,使用Davidson-MacKi

4、nnon检验,xtivreg 后使用 dmexogxt * Davidson-MacKinnon (1993) 检验* H0：OLS 和 xtivreg 都是一致的，即内生性问题对OLS的估计结果影响不大 xtivreg tl size ndts tang (npr=tobin L1.npr), fe dmexogxt Davidson-MacKinnon检验得到F统计量的P值小于0.05，代表有内生性,遗漏变量偏差可采用在多元回归中加入遗漏变量的方法加以解决，但前提是只有当你有遗漏变量数据时上述方法才可行。双向因果关系偏差是指如果有时因果关系是从X到Y又从Y到X时，此时仅用多元回归无法消

5、除这一偏差。同样，变量有测量误差也无法用我们前面学过的方法解决。因此我们就必须寻找一种新的方法。,二、内生性的解决方案,事实上，仅仅为了解决内生性问题，并不需要我们对内生性问题的缘起有很深入的理解。对于应用型的实证研究而言，我们只需要掌握解决内生性问题的具体方案即可。内生性问题的解决方案一共四种，理论上来讲，这四种方案应对内生性问题都很有效。但于我个人而言，我对四种方法的评价是有高低的，由高到低分别介绍如下。,1.自然实验法,所谓自然实验，就是发生了某些外部突发事件，使得研究对象仿佛被随机分成了实验组或控制组。这是我最喜欢的方法，只是自然实验需要寻找一个事件，并且这个事件只影响解释变量而

6、不影响被解释变量。遇着这种事件是一种缘分，还要能识别出来，这对学者的眼光也是一种挑战。有很多文章声称使用了自然实验，但严格来讲，并没有做到对研究对象进行了随机分组。虽然如此，我对此类文章仍然很是喜欢。,自然实验包括的要素有:一个政策措施(treatment),一个观察到的结果(outeome),一个对照组(contorlgoruP)。在评估“政策措施”对“结果”是否发挥作用时,对照组充当一个参照系。而一个“准自然实验”和自然实验的区别在于处理组和对照组的选取是否随机。这里的“结果”是以受政策影响的县和没有受政策影响的县之间在增长速度上的差异来衡量。简单连接改革措施和被直管县绩效的做法并不

7、恰当。这样的做法无法排除其他政策或是整体经济的影响,因而是无法衡量改革真实效果的。,17,2.双重差分法,Difference-in-Difference （DID）一般称为双重差分法，或倍差法。倘若出现了一次外部冲击，这次冲击影响了一部分样本，对另一部分样本则无影响，而我们想看一下这次外部冲击到底有何影响，双重差分法就是用来研究这次冲击的净效应的。其基本思想是，将受冲击的样本视作实验组，再按照一定标准在未受冲击的样本中寻求与实验组匹配的对照组，而后做差，做差剩下来的便是这次冲击的净效应。双重差分法实际上是固定效应的一个变种，差分的过程实际上是排除固定效应的过程。ZERA在计量论文写作和发

8、表的黑客教程有一个非常简明风趣的举例，我转述于此，以飨读者。,19,Difference in difference models,Maybe the most popular identification strategy in applied work today Attempts to mimic random assignment with treatment and “comparison” sample Application of two-way fixed effects model,20,Problem set up,Cross-sectional and time seri

9、es data One group is treated with intervention Have pre-post data for group receiving intervention Can examine time-series changes but, unsure how much of the change is due to secular changes,21,Difference in difference models,Basic two-way fixed effects model Cross section and time fixed effects Us

10、e time series of untreated group to establish what would have occurred in the absence of the intervention Key concept: can control for the fact that the intervention is more likely in some types of states,22,Three different presentations,Tabular Graphical Regression equation,23,Difference in Differe

11、nce,24,time,Y,t1,t2,Yt1,Yt2,treatment,control,Yc1,Yc2,Treatment effect= (Yt2-Yt1) (Yc2-Yc1),25,Key Assumption,Control group identifies the time path of outcomes that would have happened in the absence of the treatment In this example, Y falls by Yc2-Yc1 even without the intervention Note that underl

12、ying levels of outcomes are not important (return to this in the regression equation),26,Basic Econometric Model,Data varies by state (i) time (t) Outcome is Yit Only two periods Intervention will occur in a group of observations (e.g. states, firms, etc.),27,Three key variables Tit =1 if obs i belo

13、ngs in the state that will eventually be treated Ait =1 in the periods when treatment occurs TitAit - interaction term, treatment states after the intervention Yit = 0 + 1Tit + 2Ait + 3TitAit + it,28,Yit = 0 + 1Tit + 2Ait + 3TitAit + it,29,More general model,Data varies by state (i) time (t) Outcome

14、 is Yit Many periods Intervention will occur in a group of states but at a variety of times,30,ui is a state effect vt is a complete set of year (time) effects Analysis of covariance model Yit = 0 + 3 TitAit + ui + t + it,31,Group effects Capture differences across groups that are constant over time

15、 Year effects Capture differences over time that are common to all groups,32,其中，d 就是双重差分估计量，Y 为研究的结局变量，右侧脚标中 treatment 和 control 分布代表干预组和对照组，t0 和 t1 分别代表干预前和干预后。构造了差分估计量之后，就要根据不同的数据类型和不同的结局变量 Y，分别选用相应的参数检验方法来进行建模。,( 1) 适用于独立混合横截面数据,33,独立混合横截面数据是在不同时点从同一个的大总体内部分别进行随机抽样，将所得的数据混合起来的一种数据集。该类

16、数据的特点为每一条数据都是独立的观测值。通过将不同时点的多个观测值结合起来，从而可以加大样本量以获得更精密的估计量和更具功效的检验统计量; 也可加入新的变量时间( 即干预前后) ，以便判断干预前后的差别。对于总体一致、范围较大、涉及不同时间点的调查研究，多收集此类数据,34,35,36,( 2) 适用于综列数据面板数据的 DID 模型,37,面板数据要求在不同时点调查相同的研究对象。它与独立混合横截面数据最大的不同在于，不同时点的观测值并不是独立分布的。这类数据的特点在于: 由于研究的个体相同，一些不随时间改变的不可观测的因素( 如个人特质等) 对不同时点的观测值会产生影响，可以通过控制这些影响从而得到较为真实的结果;,38,39,40,由于一般大规模的人群调查存在较大的变异性问题，仅在模型中纳入虚拟变量“分组 ( A) ”、“时间( T) ”是远远不够的。为了提高解释系数 R2，需要加入其他可能影响被解释变量的因素，即控制除分组、时间变量以外的其他变量。,ssc install diffhelp dif

展开阅读全文