文档详情

7.第六章内生解释变量解析

桔****
实名认证
店铺
PPT
1.10MB
约52页
文档ID:579615844
7.第六章内生解释变量解析_第1页
1/52

第六章第六章 内生解释变量内生解释变量第一节第一节 解释变量内生性的成因与检验解释变量内生性的成因与检验第二节第二节 解释变量内生性检测解释变量内生性检测第三节第三节 内生性问题的解决办法内生性问题的解决办法 第一节  解释变量内生性的成因与检验解释变量与随机误差项之间往往存在某种程度的相关性,即:解释变量与随机误差项之间往往存在某种程度的相关性,即:          此此时,就称模型存在,就称模型存在内生性内生性问题,与随机,与随机误差差项相关的解相关的解释变量称量称为内生解内生解释变量量一、解一、解释变量内生性及其影响量内生性及其影响         这称称为解解释量的量的外生性假定外生性假定 解解释变量与随机量与随机误差差项是是线性无关的(甚至是均性无关的(甚至是均值独立的),独立的),即要求即要求 内生性会对内生性会对OLSE的统计性质产生不良影响的统计性质产生不良影响1、、影响无偏性影响无偏性如果假定如果假定SLR.3′(不相关假定)不成立,(不相关假定)不成立,则一定一定违背古典假背古典假定定SLR.3的均的均值独立假定,即独立假定,即                    一定不成立。

而假一定不成立而假定定SLR.3(均(均值独立)是独立)是OLSE无偏性成立的关无偏性成立的关键假定由((2.22)知:)知:==≠0 2、、影响一致性影响一致性如果如果≠0,,则,,                                                  ,,OLSE不再具有一致性不再具有一致性 3、其它影响、其它影响其它不良影响还包括,随机误差项的方差估计量是有偏的,其它不良影响还包括,随机误差项的方差估计量是有偏的,由此导致回归系数的方差估计量是有偏的,进而与方差相由此导致回归系数的方差估计量是有偏的,进而与方差相关的假设检验、区间估计容易导出错误的结论这些影响关的假设检验、区间估计容易导出错误的结论这些影响需要结合内生性产生的具体的原因进行分析需要结合内生性产生的具体的原因进行分析 二、内生性二、内生性产生的原因生的原因横截面回归中解释变量内生性产生的原因主要有遗漏变量、横截面回归中解释变量内生性产生的原因主要有遗漏变量、错误的函数形式、测量误差和联立性错误的函数形式、测量误差和联立性1、、遗漏漏变量量在建立计量经济模型时,由于人们认识上的偏差,理论分析在建立计量经济模型时,由于人们认识上的偏差,理论分析的缺陷,或者是有关统计数据的影响,导致有意或无意地忽的缺陷,或者是有关统计数据的影响,导致有意或无意地忽略了某些重要变量,未能将其作为解释变量引入模型,这种略了某些重要变量,未能将其作为解释变量引入模型,这种变量就称为变量就称为遗漏变量遗漏变量((Omitted Variable)。

被遗漏的变量虽)被遗漏的变量虽未引入模型,但其对因变量的影响还是存在的,其影响由随未引入模型,但其对因变量的影响还是存在的,其影响由随机误差项体现出来如果被遗漏变量和模型中现有的解释变机误差项体现出来如果被遗漏变量和模型中现有的解释变量存在相关,则会造成解释变量与随机误差项的相关,即产量存在相关,则会造成解释变量与随机误差项的相关,即产生内生性问题生内生性问题 考虑成年劳动者的工资方程中存在未观测到的能力的问题考虑成年劳动者的工资方程中存在未观测到的能力的问题 ((6.1)) 其中其中y代表工代表工资的的对数,数,x1代表受教育年限,代表受教育年限,x2代表个人能力,代表个人能力,u是随机是随机误差差项6.2)) 若若x2无法准确无法准确测量,将其量,将其归入随机入随机误差差项中,得到如下回中,得到如下回归模型:模型:其中其中v中包含了中包含了x2显然,若是然,若是x2与与x1相关,相关,则会会导致致 ,,                             从而从而产生内生性生内生性问题 将正确模型(将正确模型(6.1)式代入()式代入(6.3)式得)式得对(对(6.2)式进行回归)式进行回归,, x1的系数估计量为的系数估计量为:((6.3))      ((6.3)) ((1)若遗漏的)若遗漏的 x2与与x1 相关,则(相关,则(6.4)、()、(6.5)式中的第)式中的第二项在小样本的期望与大样本下的概率极限都不会为零,二项在小样本的期望与大样本下的概率极限都不会为零,使得普通最小二乘估计量使得普通最小二乘估计量OLSE是有偏的,在大样本下也是是有偏的,在大样本下也是不一致的。

不一致的6.5)) ((2)若)若 x2与与x1不相关,则由(不相关,则由(6.4)、()、(6.5)易知)易知 的估的估计量满足无偏性与一致性,但这时计量满足无偏性与一致性,但这时 的估计却是有偏的的估计却是有偏的3)) 随机误差项的方差估计随机误差项的方差估计 也是有偏的也是有偏的                      ((4)) 的方差是真实估计量的方差是真实估计量 的方差的有偏估计的方差的有偏估计 在搜集数据时,如果遇到所搜集的数据不能确实地反映变在搜集数据时,如果遇到所搜集的数据不能确实地反映变量间经济行为的情况,就称模型中包含了量间经济行为的情况,就称模型中包含了测量误差测量误差((Measurement Errors)具体来说,测量误差是指在收集)具体来说,测量误差是指在收集数据过程中的数据过程中的登记误差登记误差、在数据加工整理过程中的、在数据加工整理过程中的整理误整理误差差以及其他以及其他统计误差统计误差测量误差出现的原因是多方面的测量误差出现的原因是多方面的首先,调查登记本身就可能产生误差;首先,调查登记本身就可能产生误差;其次,数据的加工处理过程中也可能导致一定的误差;其次,数据的加工处理过程中也可能导致一定的误差;此外,数据的不当使用也会出现误差,此外,数据的不当使用也会出现误差,测量误差可能是被解释变量的测量误差,也可能是解释变测量误差可能是被解释变量的测量误差,也可能是解释变量的测量误差。

量的测量误差2、、测量量误差差 ((1)因变量存在测量误差)因变量存在测量误差 ,且与自变量不相关,,且与自变量不相关, ,则,则OLS估计量具有良好的性质,是估计量具有良好的性质,是无偏和一致的无偏和一致的2)因变量存在测量误差)因变量存在测量误差 ,且与自变量相关,,且与自变量相关, ,则产生,则产生内生性问题,内生性问题,OLSE是是有偏且不一致的有偏且不一致的测量误差造成的内生性也会影响回归分析的结果测量误差造成的内生性也会影响回归分析的结果3)自变量存在测量误差)自变量存在测量误差 ,且与自变量测量值不相关、与,且与自变量测量值不相关、与随机误差不相关,则随机误差不相关,则估计值是一致的,但方差会变大估计值是一致的,但方差会变大4)自变量存在测量误差,且与自变量测量值相关,则产)自变量存在测量误差,且与自变量测量值相关,则产生内生性问题,生内生性问题,OLSE是不一致的是不一致的OLSE常常会低估真实的常常会低估真实的回归参数回归参数注意注意:回归变量的测量误差是数据问题,目前计量经济学家:回归变量的测量误差是数据问题,目前计量经济学家们还们还提不出有效的解决方法提不出有效的解决方法。

一般的做法往往是一般的做法往往是忽略测量误忽略测量误差问题差问题,主观上希望测量误差足够小,从而不破坏回归分析,主观上希望测量误差足够小,从而不破坏回归分析假定的合理性假定的合理性 例如,如果例如,如果“真实真实”的回归函数为的回归函数为但却将模型设定为但却将模型设定为错误的函数形式错误的函数形式((Wrong Functional Form)是指在设定模)是指在设定模型时,选取了不正确的函数形式最常见的就是当型时,选取了不正确的函数形式最常见的就是当“真实真实”的函数形式为非线性时,却选取了线性的函数形式的函数形式为非线性时,却选取了线性的函数形式3、、错误的函数形式错误的函数形式由错误的函数形式造成了内生性,即使其他假设均成立,由错误的函数形式造成了内生性,即使其他假设均成立,且样本很大,普通且样本很大,普通最小二乘估计量也是不一致的最小二乘估计量也是不一致的 由于经济现象的错综复杂,大多数经济问题中各变量之间由于经济现象的错综复杂,大多数经济问题中各变量之间存在反馈效应要描述经济现象的这种复杂关系,必须从存在反馈效应要描述经济现象的这种复杂关系,必须从整体和系统的角度进行,建立由多个相互联系的单一方程整体和系统的角度进行,建立由多个相互联系的单一方程组成的组成的联立方程模型联立方程模型才能完整表达。

正如单方程模型会遇才能完整表达正如单方程模型会遇到内生性问题,联立方程模型更容易遇到内生性问题因到内生性问题,联立方程模型更容易遇到内生性问题因为在联立方程模型中,结构式中已包含有其它的内生变量,为在联立方程模型中,结构式中已包含有其它的内生变量,所以在从结构式到简约式的转化中,自然也把误差项带入所以在从结构式到简约式的转化中,自然也把误差项带入了其它的结构式中,产生了其它的结构式中,产生联立性联立性((Simultaneity),进而不),进而不可避免地造成内生性由于内生性的存在,会使得可避免地造成内生性由于内生性的存在,会使得OLS估计估计量是有偏的和不一致的量是有偏的和不一致的4、、联立性联立性 检验的基本思想检验的基本思想:如果不知道遗漏了哪个变量,可寻找一:如果不知道遗漏了哪个变量,可寻找一个替代变量来进行遗漏变量检验,替代变量通常选用所设个替代变量来进行遗漏变量检验,替代变量通常选用所设定模型被解释变量的拟合值定模型被解释变量的拟合值 的若干次幂的线性组合若模的若干次幂的线性组合若模型估计所得的残差包含着遗漏的相关变量,那么这个残差型估计所得的残差包含着遗漏的相关变量,那么这个残差可用被解释变量拟合值若干次幂的线性组合近似表示;若可用被解释变量拟合值若干次幂的线性组合近似表示;若这个线性组合是显著的,则认为原模型设定有误(遗漏变这个线性组合是显著的,则认为原模型设定有误(遗漏变量)。

由于可引入若干个替代变量去判断是否有多个变量量)由于可引入若干个替代变量去判断是否有多个变量被遗漏,所以该方法被称为一般性设定误差检验被遗漏,所以该方法被称为一般性设定误差检验拉姆齐拉姆齐(Ramsey,,1969)提出了一种提出了一种“回归设定误差检验回归设定误差检验”((Regression Specification Error Test),简称),简称RESET检验第二节第二节      解释变量内生性检测解释变量内生性检测一、一、RESET检验 第一步:用第一步:用OLS法对模型(法对模型(6.7)进行回归估计)进行回归估计RESET检验的基本步骤为:检验的基本步骤为:((6.7)) 第二步:用被解释变量的拟合值第二步:用被解释变量的拟合值 的若干次幂的若干次幂 的线性组合,的线性组合,测度残差中是否包含着遗漏的相关变量测度残差中是否包含着遗漏的相关变量具体做法为,在第一步的模型(具体做法为,在第一步的模型(6.7)中增加一个包含拟合值)中增加一个包含拟合值 的函数这个函数通常选择为拟合值的函数这个函数通常选择为拟合值 的平方、立方和四的平方、立方和四次方的线性组合。

例如:次方的线性组合例如: 其中,其中, RSSU为对模型模型(6.8)(相当于无(相当于无约束模型)束模型)进行回行回归得到的残差平方和,得到的残差平方和, RSSR 为模型(模型(6.7)(有)(有约束模型)束模型)进行回行回归得到的残差平方和,得到的残差平方和,dfU 和和 dfR分分别为 前二者的自由度前二者的自由度针对模型(模型(6.8),(),(6.9)式可以写)式可以写为::其中其中n为样本个数,本个数,k为解解释变量个数第三步:提出原假设:第三步:提出原假设: 构造F统计量:统计量:((6.9)) ((6.10)) 第第四四步步::给定定显著著性性水水平平   ,,若若F统计值大大于于等等于于临界界值    ,,则拒拒绝原原假假设,,表表明明存存在在设定定误差差((遗漏漏变量量)),,否否则,,说明明不不存存在在设定定误差差((遗漏漏变量量))类似似的的,,也也可可以以利利用用F统计值对应的的概概率率值来来判判断断::如如果果概概率率值小小于于等等于于   ,,则拒拒绝原原假假设,,表表明明存存在在设定定误差差((遗漏漏变量量)),,否否则,,说明明不不存在存在设定定误差(差(遗漏漏变量)。

量) 表表6-1 城镇居民人均可支配收入和人均消费性支出抽样调查数据(元)城镇居民人均可支配收入和人均消费性支出抽样调查数据(元)〔〔例例6--1〕〕关于城镇居民的消费行为,某些研究者认为由关于城镇居民的消费行为,某些研究者认为由于有较高的社会福利保障,以绝对收入假说消费函数模型于有较高的社会福利保障,以绝对收入假说消费函数模型为理论模型,能够得到理想的拟合结果,因而得出为理论模型,能够得到理想的拟合结果,因而得出城镇居城镇居民的消费行为应该服从绝对收入消费理论假说,收入是唯民的消费行为应该服从绝对收入消费理论假说,收入是唯一显著的变量一显著的变量用表6-1的样本数据验证这一结论是否正确的样本数据验证这一结论是否正确家庭序号家庭序号可支配收入可支配收入 消消费性支出性支出y家庭序号家庭序号可支配收入可支配收入 消消费性支出性支出y11510.21278.891162804998.0021700.61554.86126859.65309.0032026.61840.59137702.86030.0042577.42110.81148472.26510.9453496.22852.34159421.67182.00642833537.5716104937943.0074838.93919.471711759.58696.5585160.34186.001813785.89997.4795425.14331.611915780.7611242.85105854.024619.9120--25410.00 模型的参数均通过了模型的参数均通过了0.01水平下的显著性检验,水平下的显著性检验,R2=0.998表表明拟合效果很好。

但是由于我们仅用当期收入来解释消费明拟合效果很好但是由于我们仅用当期收入来解释消费支出的变化,因此,可能遗漏了相关变量下面进行支出的变化,因此,可能遗漏了相关变量下面进行RESET检验利用利用EViews做回归,得样本回归方程:做回归,得样本回归方程:((6.11)) 由式(由式(6.11)估计出消费性支出)估计出消费性支出 ,在原回归模型中加入新,在原回归模型中加入新的解释变量的解释变量 、、 后重新估计,发现后重新估计,发现 的系数不显著,因的系数不显著,因此,加入变量此,加入变量 进行估计,得到估计结果:进行估计,得到估计结果:((6.12)) F统计量的值大于统计量的值大于0.05显著性水平下自由度为(显著性水平下自由度为(1,16)的)的F分分布的临界值布的临界值4.49,因此拒绝原假设,表明原模型确实存在,因此拒绝原假设,表明原模型确实存在设定误差,遗漏了相关变量,所以我们认为消费与收入之设定误差,遗漏了相关变量,所以我们认为消费与收入之间的关系可能并不像一元线性模型那么简单间的关系可能并不像一元线性模型那么简单RESET检验也可以利用检验也可以利用EViews直接来完成。

操作方法如下:直接来完成操作方法如下:作作y关于关于x的回归,然后在输出结果窗口选择的回归,然后在输出结果窗口选择View / Stability Test / Ramsey RESET Test…,在弹出的,在弹出的“Number of Fitted”对对话框中,设定代理变量个数为话框中,设定代理变量个数为1点击“OK”,检验结果如下:,检验结果如下:计算计算F统计量:统计量:=106.4448 由于由于F统计量对应的概率为统计量对应的概率为0,显然小于,显然小于 0.05,故拒绝原假,故拒绝原假设,认为遗漏了相关变量由此可见,我国城镇居民的消设,认为遗漏了相关变量由此可见,我国城镇居民的消费行为,不能认为服从绝对收入消费理论假说,线性模型费行为,不能认为服从绝对收入消费理论假说,线性模型设定有误设定有误表表6-4 EViews输出结果输出结果Ramsey RESET Test:F-statistic106.4448    Probability0.000000Log likelihood ratio38.66636    Probability0.000000Test Equation:Dependent Variable: YVariableCoefficientStd. Errort-StatisticProb.  C141.365539.013553.6234990.0023X0.8219870.01214967.659220.0000YF^2-1.42E-051.38E-06-10.317210.0000R-squared0.999723    Mean dependent var5165.361Adjusted R-squared0.999689    S.D. dependent var2859.409S.E. of regression50.43478    Akaike info criterion10.82318Sum squared resid40698.67    Schwarz criterion10.97230Log likelihood-99.82019    F-statistic28921.10Durbin-Watson stat2.455390    Prob(F-statistic)0.000000 豪斯曼内生性检验的豪斯曼内生性检验的具体步骤具体步骤为:为:1.对所研究的回归模型,无论是否存在测量误差,先采用对所研究的回归模型,无论是否存在测量误差,先采用OLS法得到参数估计量。

法得到参数估计量关于测量误差存在与否的内生性检验是豪斯曼(关于测量误差存在与否的内生性检验是豪斯曼(J. A. Hausman,,1978)提出的,其)提出的,其基本思路基本思路是,把可能存在测是,把可能存在测量误差的解释变量与其工具变量做回归,将得到的残差序量误差的解释变量与其工具变量做回归,将得到的残差序列作为解释变量加入初始的模型,如果残差序列是显著的,列作为解释变量加入初始的模型,如果残差序列是显著的,则说明存在测量误差,否则说明不存在测量误差则说明存在测量误差,否则说明不存在测量误差二、二、豪斯曼检验豪斯曼检验2.对可能存在测量误差的解释变量,选择与其相关的工具对可能存在测量误差的解释变量,选择与其相关的工具变量变量(参见本章第参见本章第3节节),将可能存在测量误差的解释变量,将可能存在测量误差的解释变量对选择的工具变量进行回归,并获得回归残差对选择的工具变量进行回归,并获得回归残差 (作为(作为自变量测量误差的代表)自变量测量误差的代表) 3.将回归残差将回归残差 作为解释变量加入第作为解释变量加入第1步中的回归模型,再步中的回归模型,再次进行次进行OLS估计,得估计,得 的参数估计值的参数估计值 及显著性检验结果。

及显著性检验结果4.若若 显著,则认为解释变量的确存在观测误差,反之,显著,则认为解释变量的确存在观测误差,反之,认为解释变量不存在测量误差认为解释变量不存在测量误差 其中,其中,ex为某某贫困地区地方政府的支出,困地区地方政府的支出,aid为中央政府的中央政府的拨款量,款量,inc为贫困地区地方政府的困地区地方政府的财政收入,政收入,pop为该地地区的区的总人口数现怀疑中央政府的疑中央政府的拨款量款量aid存在存在测量量误差我我们选择贫困人口数困人口数ps为工具工具变量,其量,其原因原因为扶扶贫支出是支出是该地区地方政府支出中比重最大的支出,其地区地方政府支出中比重最大的支出,其经费来源主要来源主要是依是依赖中央政府的中央政府的拨款,而中央政府的款,而中央政府的拨款与款与该地区地区贫困困人口数人口数ps有直接关系有直接关系,,因此因此ps与与aid有有较高相关性将高相关性将aid对ps进行回行回归,得:,得:〔〔例例6--2〕〕 假设利用观测到的样本数据作回归,已得到假设利用观测到的样本数据作回归,已得到以下结果:以下结果:((6.13)) t =  (-0.56)     (13.64)              (8.12)           (-5.17)R2=0.993             F=2190 从上式看出,因从上式看出,因为      系数的系数的t值是是1.73,小于,小于t的的临界界值1.96,,在在0.05的的显著性水平下,双著性水平下,双侧t检验接受原假接受原假设(不存在(不存在测量量误差),但在差),但在0.1的的显著性水平上,双著性水平上,双侧t检验则拒拒绝原假原假设而而接受接受备择假假设(存在(存在测量量误差)。

差)注意注意,引,引进对测量量误差可能性的修正,使差可能性的修正,使aid变量的系数量的系数变小,小,这从另一个从另一个侧面面说明,明,测量量误差夸大了差夸大了aid对ex的影响得到如下的残差变量得到如下的残差变量 ::将将 项加入(项加入(6.13),再回归得到以下结果:),再回归得到以下结果:t =  (-1.41)       (1.94)                (7.55)           (-1.29)            (1.73) 工具变量的选择应工具变量的选择应满足以下条件满足以下条件:工具变量必须具有实际:工具变量必须具有实际经济意义;工具变量与内生解释变量高度相关,但与随机经济意义;工具变量与内生解释变量高度相关,但与随机项不相关;工具变量与模型中的其他解释变量也不相关;项不相关;工具变量与模型中的其他解释变量也不相关;模型中多个工具变量之间不相关模型中多个工具变量之间不相关注意注意 ,工具变量对内生解释变量的替代并不是,工具变量对内生解释变量的替代并不是“完全完全”替代,替代,即不是用工具变量代换模型中对应的内生解释变量,而是即不是用工具变量代换模型中对应的内生解释变量,而是在最小二乘法的正规方程组中用工具变量对内生解释变量在最小二乘法的正规方程组中用工具变量对内生解释变量进行部分替代。

进行部分替代工具变量法工具变量法((Instrument Variable,,IV)是消除内生性的一)是消除内生性的一种常用方法,应用的种常用方法,应用的基本思路基本思路是,当出现内生解释变量,是,当出现内生解释变量,即解释变量与随机项相关时,则寻找另一个变量,该变量即解释变量与随机项相关时,则寻找另一个变量,该变量与内生解释变量高度相关,但与随机项不相关,称该变量与内生解释变量高度相关,但与随机项不相关,称该变量为为工具变量工具变量,用其替代内生解释变量参与参数的估计过程用其替代内生解释变量参与参数的估计过程第三节第三节   内生性问题的解决办法内生性问题的解决办法一、一、工具变量法工具变量法 由由OLS推导的正规方程和参数估计值公式为:推导的正规方程和参数估计值公式为:设有一元线性回归模型:设有一元线性回归模型:((6.16)) 采用矩方法(采用矩方法(Moment Method ,,MM)也可推导出完全一)也可推导出完全一样的结果:样的结果:((6.17)) ((6.18)) 由假定由假定SLR.3,, ,可知,可知 ,, 对应的的样本矩条件本矩条件为::即有:即有:,将,将                                                 代入,有:代入,有:整理后,得到正规方程组:整理后,得到正规方程组:((6.20)) 如果解释变量内生,则第二个矩条件不能满足,样本矩条如果解释变量内生,则第二个矩条件不能满足,样本矩条件件 也就无从谈起,所以,无法推导出(也就无从谈起,所以,无法推导出(6.21),),OLSE是不是不一致的。

一致的可可见((6.20)()(6.17)完全相同,)完全相同,MM估估计量(量(6.21)与)与OLS估估计量(量(6.18)也完全一致也完全一致说明在明在这种情况下,种情况下,OLS等价于等价于MM解得:解得:((6.21)) 此此时我我们需要需要寻找一工具找一工具变量量z满足足替换(替换(6.19)中的第二个方程,得:)中的第二个方程,得:对应的样本矩条件为对应的样本矩条件为 ,, ,即,即 ,, 这种方法称为这种方法称为工具变量法工具变量法解得:解得:对应的正规方程组为:对应的正规方程组为: 当当xj ( j=1,2,…,k) 与随机与随机项 ui相关,相关,设xj 的工具的工具变量量为 zj ( j = 1, 2, …,k),,即每一个解释变量均对应一个工具变量即每一个解释变量均对应一个工具变量这样得到方程得到方程组::将上述一元线性回归模型的工具变量法推广到多元线性回将上述一元线性回归模型的工具变量法推广到多元线性回归模型的情形:归模型的情形:根据工具变量应满足的条件,可得:根据工具变量应满足的条件,可得:将关系式将关系式代入上式,整理得:代入上式,整理得:((6.28)) 注意注意:工具变量法属于:工具变量法属于矩方法矩方法。

可以证明,无论对于一元可以证明,无论对于一元线性模型还是多元线性模型,参数的线性模型还是多元线性模型,参数的工具变量估计量都是工具变量估计量都是有偏但一致的估计量有偏但一致的估计量参数的工具变量的估计量为:参数的工具变量的估计量为:((6.29)) 其矩阵形式为:其矩阵形式为: 〔〔例例6--3〕〕 以以 代表国内生产总值,以代表国内生产总值,以 代表消费,以代表消费,以 代表代表政府支出表政府支出表6-5给出了某地上述三项指标的数据理论研给出了某地上述三项指标的数据理论研究证明,国内生产总值与随机项相关,而外生的政府支出究证明,国内生产总值与随机项相关,而外生的政府支出与随机项无关,但与国内生产总值高度相关试用工具变与随机项无关,但与国内生产总值高度相关试用工具变量法估计国内生产总值对于消费的边际效应量法估计国内生产总值对于消费的边际效应年份年份xyz年份年份xyz17164.34694.52468.6925863.615952.1 9636.02  8792.1  5773.0 3386.01034500.620182.112998.0310132.8 6542.03846.01147110.927216.219260.6411784.07451.2 4322.01258510.533635.023877.0514704.09360.1 5495.01368330.440003.926867.2616466.010556.5 6095.01474894.343579.428457.6718319.511365.2 6444.01579853.346405.930396.0821280.413145.9 515.0      表表6-5  国内生国内生产总值、消、消费、政府支出数据、政府支出数据 ((单位:位:亿元)元) 由于内生性的国内生由于内生性的国内生产总值x与随机与随机项u相关,而外生性的政相关,而外生性的政府支出府支出 z与随机与随机项 u无关,且与国内生无关,且与国内生产总值 x高度相关,故高度相关,故可用可用z 作作为国内生国内生产总值 x的工具的工具变量。

参数估量参数估计如下:如下:设消费设消费 与国内生产总值与国内生产总值 之间具有线性关系,可建立如下模型:之间具有线性关系,可建立如下模型:=0.568876.01则样本回本回归模型模型为::即国内生即国内生产总值对于消于消费的的边际效效应为0.568 EViews软件中,工具件中,工具变量法操作如下:量法操作如下:点点击 Quick / Estimate Equation,在打开的,在打开的对话框中,框中,“Estimation Settings/Method”选择“TSLS-Two-Stage Least Square(TSNLS and ARMA)”,在,在“Equation Specification”栏中中输入方程形式入方程形式“y c x”,在,在“Instrument List”栏中中输入入“c z”((图6-1) Dependent Variable: YMethod: Two-Stage Least SquaresInstrument list: C ZVariableCoefficientStd. Errort-StatisticProb.  C876.0101123.73837.0795380.0000X0.5680510.003003189.14980.0000R-squared0.999651    Mean dependent var19724.20Adjusted R-squared0.999624    S.D. dependent var14652.80S.E. of regression284.1214    Sum squared resid1049425.F-statistic35777.64    Durbin-Watson stat1.297665Prob(F-statistic)0.000000表表6-6 EViews输出结果输出结果点击点击“OK”即可得到回归结果如下:即可得到回归结果如下: 实际问题分析时往往有不只一个的外生变量被遗漏,排斥在实际问题分析时往往有不只一个的外生变量被遗漏,排斥在模型之外,且可能与内生解释变量相关,这意味着它们都是模型之外,且可能与内生解释变量相关,这意味着它们都是有效的工具变量。

这时应该如何选取工具变量来消除内生性有效的工具变量这时应该如何选取工具变量来消除内生性呢?泰尔呢?泰尔 (H. Theil,,1953)、贝斯曼、贝斯曼(R. L. Basmann,,1957)分别分别提出用提出用两阶段最小二乘法两阶段最小二乘法((Two Stage Least Square,,TSLS)来)来处理此类问题本节只讨论单个内生解释变量的处理此类问题本节只讨论单个内生解释变量的TSLS二、二、两阶段最小二乘法两阶段最小二乘法 那么,如何选择那么,如何选择“最好最好”的工具变量呢?的工具变量呢?与与y2的相关关系越的相关关系越强强的的变量,作量,作为y2的工具的工具变量越合适,所量越合适,所以将以将y2表述表述为::其中,其中,y1是被解是被解释变量,量,x1是是外生解外生解释变量量((Exogenous Variables),),y2是内生解是内生解释变量对该方程我方程我们感感兴趣的是趣的是系数系数 ,所以可以称,所以可以称为结构方程构方程((Structural Equation)如果存在两个外生果存在两个外生变量量z1、、z2,与,与u不相关,与不相关,与y2相关,相关,则z1与与z2都可以作都可以作为y2的工具的工具变量。

而且,既然量而且,既然x1、、z1、、z2均与均与u不相不相关,那么其任何关,那么其任何线性性组合也与合也与u不相关,即不相关,即x1、、z1、、z2的任意的任意线性性组合都可以作合都可以作为y2的工具的工具变量假设有二元回归模型:假设有二元回归模型:((6.32)) 即用内生变量对所有的外生变量和工具变量构造回归模型,即用内生变量对所有的外生变量和工具变量构造回归模型,对应于最初的结构方程,该方程我们称之为对应于最初的结构方程,该方程我们称之为简化方程简化方程((Reduced Equation)即是我们要得到的工具变量即是我们要得到的工具变量注意注意::为避免避免产生多重共线性,这里要求模型产生多重共线性,这里要求模型(6.32)中中 至少有一个不是至少有一个不是0实际应用中用中,直接用,直接用y2对所有的外生解所有的外生解释变量和工具量和工具变量量进行回行回归,得到的,得到的y2的的拟合合值作作为y2的工具的工具变量对对 的检验可以直接利用的检验可以直接利用F检验来完成检验来完成 接下来便可以利用接下来便可以利用      作作为y2的工具的工具变量量进行行OLS估估计。

这就就是是两两阶段最小二乘法段最小二乘法((Two Stage Least Square,,TSLS)顾名思名思义,所,所谓的的TSLS即是即是分两个分两个阶段估段估计模型模型,即,即第一第一阶段:利用内生解段:利用内生解释变量量y2对所有外生解所有外生解释变量和工具量和工具变量做回量做回归,得到其,得到其拟合合值      .第二第二阶段:将段:将      作作为y2的工具的工具变量量继续做回做回归,得到最,得到最终的回的回归模型 其中,其中,wage表示小表示小时工工资,,educ表示受教育情况,是内生解表示受教育情况,是内生解释变量,量,exper表示表示实际工作工作经验,是外生解,是外生解释变量,量,u与与exper和和 exper2均不相关假定我均不相关假定我们还认为母母亲的受教育情的受教育情况(况(meduc)和父)和父亲的受教育情况(的受教育情况(feduc)与)与u不相关那不相关那么我么我们可以将它可以将它们都用作内生解都用作内生解释变量量educ的工具的工具变量educ的的简化方程可写化方程可写为::〔〔例例6--4〕〕建立回建立回归模型考模型考查工工资和受教育情况、和受教育情况、实际工工作作经验之之间的关系,利用的关系,利用TSLS对模型模型进行回行回归分析。

分析设原原始模型始模型为::((6.34)) ((6.35)) 利用利用Eviews对该模型做回模型做回归,首先建立工作文件,将数据,首先建立工作文件,将数据录入点击Quick / Estimate Equation,在出,在出现的窗口中的窗口中“Estimation Settings / Method”选择“TSLS-Two-Stage Least Square(TSNLS and ARMA)”,在,在“Equation Specification”栏中中输入方程形式入方程形式“log(wage) c educ exper exper^2”,,“Instrument List”栏中中输入入“c exper exper^2 meduc feduc”,(,(图6-2) 表表6-7 EViews输出结果输出结果点击点击OK,输出结果如表,输出结果如表6-7所示Method: Two-Stage Least Squares Included observations: 428 after adjustments Instrument list: C EXPER EXPER^2 MEDUC FEDUC VariableCoefficientStd. Error t-Statistic Prob.   C0.0481000.4003280.120152 0.9044 EDUC0.0613970.0314371.953024 0.0515 EXPER0.0441700.0134323.288329 0.0011 EXPER^2-0.0008990.000402 -2.237993 0.0257 R-squared0.135708    Mean dependent var1.190173 Adjusted R-squared0.129593    S.D. dependent var0.723198 S.E. of regression0.674712    Sum squared resid193.0200 F-statistic8.140709    Durbin-Watson stat1.945659 Prob(F-statistic)0.000028    Second-Stage SSR212.2096 所估所估计的教育情况的教育情况educ回回归系数系数为0.0614,意味着其他条件,意味着其他条件不不变的前提下,每多接受一年教育工的前提下,每多接受一年教育工资平均地增加平均地增加6.14%。

由于它相由于它相对大的大的标准准误,在,在对应着双着双侧对立假立假设的的0.05的的显著水平上,著水平上,TSLS估估计值几乎不几乎不显著注意注意:如果回:如果回归模型中存在多个内生解模型中存在多个内生解释变量,那么量,那么对每个每个内生解内生解释变量都要量都要寻找工具找工具变量这涉及到模型的涉及到模型的识别问题关于关于这个个问题,可以参考本,可以参考本书第十一章第十一章联立方程模型的有关立方程模型的有关内容对应的回归方程为:对应的回归方程为: 在美国,每年大约有在美国,每年大约有40000例高速公路交通死亡事故,其中例高速公路交通死亡事故,其中大约大约1/3的致命性交通事故涉及司机醉酒驾车,而且这个比的致命性交通事故涉及司机醉酒驾车,而且这个比例在饮酒高峰期会上升例在饮酒高峰期会上升由此可见,劝阻醉酒驾车似乎可以有效减少交通死亡事故的由此可见,劝阻醉酒驾车似乎可以有效减少交通死亡事故的发生所以很多美国州政府试图通过提高啤酒税的经济方法发生所以很多美国州政府试图通过提高啤酒税的经济方法来劝阻司机醉酒驾车,进而减少交通死亡事故的发生那么来劝阻司机醉酒驾车,进而减少交通死亡事故的发生那么这项措施到底是否有效呢?斯托克收集了这项措施到底是否有效呢?斯托克收集了48个州(个体),个州(个体),从从1982年到年到1988年间的相关样本数据,利用这些数据对该措年间的相关样本数据,利用这些数据对该措施的有效性进行验证分析。

施的有效性进行验证分析我们通过斯托克、沃森(我们通过斯托克、沃森(Stock & Watson)在)在《《计量经济学计量经济学(第三版)(第三版)》》教材中引用的一个有关交通事故死亡率和啤酒教材中引用的一个有关交通事故死亡率和啤酒税的案例,说明税的案例,说明差分回归差分回归(或者称为(或者称为“前后比较前后比较”)的基本思)的基本思路三、差分回归法三、差分回归法 先利用先利用OLS对该问题进行分析选取交通事故死亡率(每万取交通事故死亡率(每万人的死亡人数)和啤酒税(以人的死亡人数)和啤酒税(以1988年美元价格年美元价格计算的每箱啤算的每箱啤酒的酒的实际啤酒税)作啤酒税)作为回回归分析的被解分析的被解释变量和解量和解释变量首先,利用首先,利用1982年年48个州的横截面数据个州的横截面数据进行分析,得到回行分析,得到回归方程和散点方程和散点图如下:如下:可可见,,啤酒税的斜率系数啤酒税的斜率系数为正正,但在,但在0.1的的显著性水平下著性水平下不不显著著 回归方程(回归方程(6.37)中啤酒税的)中啤酒税的系数为正系数为正,,且在且在0.01的水平下的水平下统计显著统计显著然后,与此类似,根据然后,与此类似,根据1988年(其它年份也可以)的年(其它年份也可以)的48个州个州的横截面数据进行分析,得到回归方程和散点图如下:的横截面数据进行分析,得到回归方程和散点图如下: 事实真的是这样吗?不一定!事实真的是这样吗?不一定!因为前面的回归分析可能含有因为前面的回归分析可能含有遗漏变量遗漏变量,有很多影响交通事故死亡率的重要变量没有作为,有很多影响交通事故死亡率的重要变量没有作为解释变量引入模型,比如:每个州所驾驶汽车的质量,汽车解释变量引入模型,比如:每个州所驾驶汽车的质量,汽车安全措施的改善,州高速公路的路况状态,公路上汽车的密安全措施的改善,州高速公路的路况状态,公路上汽车的密度,醉酒驾车在社会文化上是否可接受,等等。

这些因素中度,醉酒驾车在社会文化上是否可接受,等等这些因素中的任何一个都可能与啤酒税相关,进而造成内生性问题,导的任何一个都可能与啤酒税相关,进而造成内生性问题,导致回归结果的不准确处理这类内生性问题最简单的方法就致回归结果的不准确处理这类内生性问题最简单的方法就是搜集所需的变量数据,并将它们加入到上述模型中去但是搜集所需的变量数据,并将它们加入到上述模型中去但遗憾的是,有些变量,如醉酒驾车的文化接受度,可能很难遗憾的是,有些变量,如醉酒驾车的文化接受度,可能很难测量,甚至不可能测量此时,我们可以采用测量,甚至不可能测量此时,我们可以采用差分回归方法差分回归方法解决这些遗漏变量问题解决这些遗漏变量问题这两个方程表明,啤酒税与交通事故死亡率要么不相关,要这两个方程表明,啤酒税与交通事故死亡率要么不相关,要么啤酒税的增加会导致更高的交通事故死亡率这与预期结么啤酒税的增加会导致更高的交通事故死亡率这与预期结果是截然相反的果是截然相反的 FatalityRateit =  0 +  1BeerTaxit + 2zi +uit,       ((6.38))  i=1, 2, … , 48, t =1982, … , 1988当当t=1982和和t=1988时回回归模型可具体写模型可具体写为::假假设zi表示那些在州之表示那些在州之间发生生变化但不随化但不随时间变化的化的难以以观测的的变量(比如:量(比如:对醉酒醉酒驾车的文化的文化态度),但不同州度),但不同州总体回体回归线的斜率系数的斜率系数 1都是一都是一样的。

的该问题的回的回归模型可模型可设为::FatalityRatei1982 =  0 +  1BeerTaxi1982 + 2zi +ui1982      ((6.39))FatalityRatei1988 = 0 +  1BeerTaxi1988 + 2zi +ui1988        ((6.40))(FatalityRatei1988--FatalityRatei1982)=  1(BeerTaxi1988--BeerTax i1982)+(u i1988--u i1982)用(用(6.40)减去()减去(6.39),得到:),得到:即即((6.41)) 对所有对所有48个州的数据进行差分计算,得到个州的数据进行差分计算,得到 的的48个观测点(散个观测点(散点图见图点图见图6-5),据此估计的样本回归方程为),据此估计的样本回归方程为即在即在                         的的变化中,不随化中,不随时间变化的化的难以以观测的的变量量zi的效的效应被减掉了(被减掉了(说明尽管明尽管zi对交通事故死亡率的水平交通事故死亡率的水平值有影响,但由于它在不同有影响,但由于它在不同时间上的效上的效应固定,所以固定,所以对交通事交通事故死亡率的故死亡率的变动没有影响),啤酒税的没有影响),啤酒税的变化化 是唯一的解是唯一的解释变量,量,这就解决了就解决了变量量遗漏漏对参数估参数估计带来的偏差,也就解决来的偏差,也就解决了(了(6.36)和()和(6.37)的解)的解释变量内生性量内生性问题。

6.42)) 图图6-5 差分数据散点图和差分数据散点图和OLS回归函数回归函数 方程(方程(6.42)考虑了啤酒税不变情况下死亡率平均变化不)考虑了啤酒税不变情况下死亡率平均变化不为为0的可能性,所以包含了截距项,即截距项代表的是啤的可能性,所以包含了截距项,即截距项代表的是啤酒税没有发生变化时,交通事故死亡率的变化量由于其酒税没有发生变化时,交通事故死亡率的变化量由于其t统计量不显著,所以总体上可能为统计量不显著,所以总体上可能为0斜率项为负斜率项为负,而且,而且在在0.05水平下拒绝了总体斜率系数为水平下拒绝了总体斜率系数为0的假设,说明平均而的假设,说明平均而言,啤酒税上涨言,啤酒税上涨1美元美元/箱,则交通事故死亡率减少箱,则交通事故死亡率减少1.04人人/万人由于这些数据中,死亡率的平均数大约为万人由于这些数据中,死亡率的平均数大约为2人人/万人,万人,所以,这一边际效应估计值是非常大的:所以,这一边际效应估计值是非常大的:如果每箱啤酒税如果每箱啤酒税上涨上涨1美元,则交通事故死亡率大约下降一半美元,则交通事故死亡率大约下降一半!!((6.42)) 。

下载提示
相似文档
正为您匹配相似的精品文档