第11章面板数据模型课件.ppt

资源描述

《第11章面板数据模型课件.ppt》由会员分享，可在线阅读，更多相关《第11章面板数据模型课件.ppt（81页珍藏版）》请在金锄头文库上搜索。

1、1第第1111章章面板数据模型面板数据模型o一、面板数据模型简介一、面板数据模型简介o二、混合最小二乘回归二、混合最小二乘回归o三、固定效应模型三、固定效应模型o四、随机效应模型四、随机效应模型o五、模型设定检验五、模型设定检验o六、动态面板数据模型六、动态面板数据模型2一、面板数据模型简介一、面板数据模型简介o（一）何谓（一）何谓“面板数据面板数据(panel data)”？o时间维度时间维度+截面维度截面维度o如在分析中国各省份经济增长的决定因素时，共如在分析中国各省份经济增长的决定因素时，共有有31个截面，每个截面都取个截面，每个截面都取1979-2008共共30年的数年的数据，则共有

2、据，则共有930个观察值，这就是一个典型的面板个观察值，这就是一个典型的面板数据。数据。o上市公司财务数据，研究一段时期内（上市公司财务数据，研究一段时期内（1998-2008）20家上市公司股利的发放数额与股票账面家上市公司股利的发放数额与股票账面价值之间的关系，共有价值之间的关系，共有20 11=220个观测值。个观测值。3表1 1996-2002年中国15个省的居民家庭人均消费数据（不变价格）地区人均消费地区人均消费1996199719981999200020012002CP-AH（安徽）3282.4663646.1503777.4103989.5814203.5554495.17447

3、84.364CP-BJ（北京）5133.9786203.0486807.4517453.7578206.2718654.43310473.12CP-FJ（福建）4011.7754853.4415197.0415314.5215522.7626094.3366665.005CP-HB（河北）3197.3393868.3193896.7784104.2814361.5554457.4635120.485CP-HLJ（黑龙江）2904.6873077.9893289.9903596.8393890.5804159.0874493.535CP-JL（吉林）2833.3213286.4323477.56

4、03736.4084077.9614281.5604998.874CP-JS（江苏）3712.2604457.7884918.9445076.9105317.8625488.8296091.331CP-JX（江西）2714.1243136.8733234.4653531.7753612.7223914.0804544.775CP-LN（辽宁）3237.2753608.0603918.1674046.5824360.4204654.4205402.063CP-NMG（内蒙古）2572.3422901.7223127.6333475.9423877.3454170.5964850.180CP-SD

5、（山东）3440.6843930.5744168.9744546.8785011.9765159.5385635.770CP-SH（上海）6193.3336634.1836866.4108125.8038651.8939336.10010411.94CP-SX（山西）2813.3363131.6293314.0973507.0083793.9084131.2734787.561CP-TJ（天津）4293.2205047.6725498.5035916.6136145.6226904.3687220.843CP-ZJ（浙江）5342.2346002.0826236.6406600.7496950

6、.7137968.3278792.2104表2 上市公司的投资与股票账面价值5（二）面板数据模型的优点（二）面板数据模型的优点o面板数据模型（paneldatamodel），即研究和分析面板数据的模型。它的变量取值都带有时间序列和横截面的两重性。一般线性模型只单独处理横截面数据或时间序列数据，而不能同时分析和对比它们。面板数据模型，相对于一般的线性回归模型，其长处在于它既考虑到了横截面数据存在的共性，又能分析模型中横截面因素的个体特殊效应。o当然我们也可以将横截面数据简单堆积起来用当然我们也可以将横截面数据简单堆积起来用OLS回归模型来处理，但这样做就丧失了分析个体特殊回归模型来处理，但这样做

7、就丧失了分析个体特殊效应的机会效应的机会。6面板数据模型的优点面板数据模型的优点o第一，第一，Panel Data Model通过对不同横截面单元不通过对不同横截面单元不同时间观察值的结合，增加了自由度，减少了解释同时间观察值的结合，增加了自由度，减少了解释变量之间的共线性，从而得到更为有效的估计量；变量之间的共线性，从而得到更为有效的估计量；o第二，第二，Panel Data Model是对同一截面单元集的重是对同一截面单元集的重复观察，能更好地研究经济行为变化的动态性；复观察，能更好地研究经济行为变化的动态性；o第三，第三，Panel Data Model可以通过设置虚拟变量对可以通过设置

8、虚拟变量对个别差异（个别差异（非观测效应非观测效应）进行控制；即）进行控制；即面板数据模面板数据模型可以用来有效处理遗漏变量（型可以用来有效处理遗漏变量（omitted varaiable）的模型错误设定问题）的模型错误设定问题。遗漏变量遗漏变量o使用面板数据的一个主要原因是，面板数据可以用使用面板数据的一个主要原因是，面板数据可以用来处理某些遗漏变量问题。来处理某些遗漏变量问题。o例如，遗漏变量是不随时间而变化的表示个体异质例如，遗漏变量是不随时间而变化的表示个体异质性的一些变量，如国家的初始技术效率、城市的历性的一些变量，如国家的初始技术效率、城市的历史或个人的一些特征等。史或个人的一些特

9、征等。这些不可观测的不随时间这些不可观测的不随时间变化的变量往往和模型的解释变量相关，从而产生变化的变量往往和模型的解释变量相关，从而产生内生性，导致内生性，导致OLS估计量有偏且不一致估计量有偏且不一致。o面板数据对遗漏变量问题的解决得益于面板数据对面板数据对遗漏变量问题的解决得益于面板数据对同一个个体的重复观测。同一个个体的重复观测。78何谓何谓“非观测效应非观测效应”？o非观测效应非观测效应(unobserved effect)，是指在面板数据分，是指在面板数据分析中，一个不可观测的、因截面个体而异、但不随析中，一个不可观测的、因截面个体而异、但不随时间变化的变量。时间变化的变量。o非观

10、测效应通常被解释为对截面个体特征的捕捉。非观测效应通常被解释为对截面个体特征的捕捉。o比如研究：比如研究：“交通死亡率与酒后驾车人数的关系交通死亡率与酒后驾车人数的关系”（样本为一段时间内浙江省（样本为一段时间内浙江省11个地级市）个地级市）o非观测因素：汽车本身状况、道路质量、当地的饮非观测因素：汽车本身状况、道路质量、当地的饮酒文化、单位道路的车辆密度。酒文化、单位道路的车辆密度。o非观测效应的存在导致非观测效应的存在导致OLS估计结果不准确，而面估计结果不准确，而面板数据可以控制和估计非观测效应。板数据可以控制和估计非观测效应。9（三）面板数据描述的（三）面板数据描述的StataStat

11、a操作操作o（1）设定截面变量和时间变量）设定截面变量和时间变量otsset panelvar timevaro（2）描述性统计）描述性统计osum var1 var2 可得到变量的基本统计量可得到变量的基本统计量oxtsum var1 var2 分组内分组内(within)、组间、组间(between)和和样本整体样本整体(overall)计算各变量的基本统计量计算各变量的基本统计量10（四）面板数据模型的一般描述（四）面板数据模型的一般描述11面板数据模型的一般描述(续1)12面板数据模型的一般描述(续2)面板数据模型的一般描述(续3)o1314（五）面板数据的估计方法（五）面板数据的估计

12、方法o1、混合最小二乘回归（、混合最小二乘回归（pooled OLS）o2、固定效应模型（、固定效应模型（fixed effects model）o3、随机效应模型（、随机效应模型（random effects model）o4、动态面板模型（、动态面板模型（dynamic panel data）15二、混合普通最小二乘回归二、混合普通最小二乘回归oWooldridge第第13章章o使用混合横截面数据（pooledcrosssection，将混合将混合在一起的数据看作是横截面数据在一起的数据看作是横截面数据）的一个理由是要加大样本容量，把在不同时点从同一总体中抽取的多个随机样本混合起来，可以获

13、得更精密的估计量和更有效的检验统计量。o回归所得截距项在不同时期可以有不同的值。可以进行带有时期(年份)虚拟变量多元线性回归。16o例例1：不同时期：不同时期的妇女生育率的妇女生育率oFERTIL1.RAWo1972年和1984年社会总调查（GeneralSocialSurvey）17例2：教育回报和工资中性别差异的变化o跨越1978年（基年）和1985年两期的一个混合对数工资方程。oCP78-85.RAW。18两时期面板数据分析两时期面板数据分析o比如有关个人、企业或城市、国家的横截面，现有两年的数据，称之为t=1，t=2。oCRIME2.RAW包含1982和1987年若干城市的犯罪和失业的

14、数据。如果用1987年为横截面数据做回归，得到o可以得出增加失业率会降低犯罪率的结论吗可以得出增加失业率会降低犯罪率的结论吗？19两时期面板数据分析两时期面板数据分析( (续续1)1)o上述回归很可能存在遗漏变量问题遗漏变量问题。o一个解决办法是，控制住更多的因素，如年龄、性别、教育、执法水平等。o另一种方法是，把影响因变量的观测不到的因素分为两类：一类是恒常不变的；另一类则随时间而变。od2t表示当t=1时等于0而当t=2时等于1的一个虚拟变量，它不随i而变。ai概括了影响yit的全部观测不到的、在时间上恒定的因素，通常称作非观测效应，也称为固定效应，即ai在时间上是固定的。特质误差uit表

15、示随时间变化的那些非观测因素。20两时期面板数据分析两时期面板数据分析( (续续2)2)o前述1982和1987年城市犯罪率的一个非观测效应模非观测效应模型型是：oai代表了影响城市犯罪率的、不随时间而变的全部因素，诸如城市的地理位置、居民的某些人口特征（种族、教育）、城市居民对待犯罪的态度等。o给定两年的面板数据，如何估计1？21两时期面板数据分析两时期面板数据分析( (续续3)3)o一种方法一种方法，将两年的数据混合起来，然后用OLS。为使混合OLS得到1的一致估计，就必须假定非观测效应ai与xit 不相关。o其中，称为复合误差(compositeerror)。o这一结果与1987年数据的

16、横截面OLS回归结果不一样。注意，使用混合OLS并不解决遗漏变量问题。22两时期面板数据分析两时期面板数据分析( (续续4)4)o另一种方法另一种方法，考虑了非观测效应与解释变量相关性。（面板数据模型主要就是为了考虑非观测效应与解面板数据模型主要就是为了考虑非观测效应与解释变量相关性的情形释变量相关性的情形）例如在犯罪方程中，让ai中的未测出的却影响着犯罪率的因素也与失业率相关。处理方法就是一阶差分（一阶差分（first-differenced）。o非观测效应被差分掉了，方程已满足OLS假定。23两时期面板数据分析两时期面板数据分析( (续续5)5)o上述犯罪率模型用一阶差分方程估计结果：o差

17、分后的估计结果与前面不同差分后的估计结果与前面不同。24三、固定效应估计法三、固定效应估计法o取一阶差分仅是消除固定效应ai的许多方法之一。更好的方法是固定效应变换固定效应变换。考虑仅有一个解释变量的模型：o对每个i求方程在时间上的平均，得到o两式相减，得到o(是y的除去时间均值后的数据)25固定效应估计量o固定效应变换，又称“组内变换组内变换(withintransformation)”，非观测效应ai已随之消失，可以用混合OLS进行估计。基于除去时间均值变量的混合OLS估计量就是固定效应估计量(fixedeffectedestimator)或组内估计量(withinestimator)。o

18、固定效应估计量固定效应估计量=组内估计量组内估计量26组间估计量o对横截面方程o使用OLS估计时，就得到了组间估计量(betweenestimator)。273个决定系数R2o面板数据模型回归结果可得到3个决定系数：oR2(overall)，表示混合OLS(pooledOLS)回归的R2oR2(within)，表示组内估计(或固定效应变换)的R2oR2(between)，表示组间估计的R228虚拟变量回归o固定效应模型也可以理解为，每一个横截面个体i都有自己不随时间变化的非观测效应ai。o在估计时，可以为每一个i安排一个虚拟变量，得到各自的截距项，这就是虚拟变量回归虚拟变量回归(dummyva

19、riableregression)。29固定效应模型的虚拟变量回归o其中，其中， i=1,2,3.N，为截面标示；，为截面标示；t=1,2,. T，为时间标，为时间标示示；xit为为k1解释变量，解释变量，为为k1系数列向量。系数列向量。o对于特定的个体对于特定的个体i 而言，而言， ai表示那些不随时间改变的影表示那些不随时间改变的影响因素，而这些因素在多数情况下都是无法直接观测响因素，而这些因素在多数情况下都是无法直接观测或难以量化的，称为或难以量化的，称为“个体效应个体效应”(individual effects)。o在固定效应模型中，解释变量的参数在固定效应模型中，解释变量的参数对

20、各经济主体都对各经济主体都相同，属于共同部分，所以不同经济主体的差异完全相同，属于共同部分，所以不同经济主体的差异完全体现在常数项参数体现在常数项参数ai的取值上。的取值上。30图示GDPX(Invest、edu)北京江苏省山西省基础设施更加完善，受教育程度较好、经济结构以服务业为主、法制更健全31固定效应模型的虚拟变量回归32o1代表元素都为1的n维列向量。进一步，可以将与常数项参数ai相关的mnm维矩阵写成D，而将不包含常数项参数相关的相关的mnk维矩阵写成X，则面板数据的固定效应模型又可以更简洁地表示为：o由于上式的矩阵由于上式的矩阵D的列向量可以理解为代表第的列向量可以理解为代表第i个

21、经个经济主体的虚拟变量，通常也可将固定效应模型称为济主体的虚拟变量，通常也可将固定效应模型称为最小二乘虚拟变量模型最小二乘虚拟变量模型(Least squares dummy variable model, LSDV)。固定效应模型的虚拟变量回归33固定效应模型的固定效应模型的Stata操作操作o（1）设定截面变量和时间变量）设定截面变量和时间变量otsset panelvar timevaro（2）固定效应模型估计）固定效应模型估计oxtreg y x1 x2 x3, feo（3）导出固定效应回归的个体截距项）导出固定效应回归的个体截距项opredictv, uogen c=v+_b_con

22、s o或者，直接进行或者，直接进行LSDV估计估计oxtreg y x1 x2 x3 i.panelvar34固定效应VS一阶差分固定效应固定效应35固定效应VS一阶差分一阶差分一阶差分36四、随机效应模型四、随机效应模型o假定一个非观测效应模型为：假定一个非观测效应模型为：o固定效应法和一阶差分法的目的都是要把ai消去，因为ai被认为是与xitj中的一个或多个相关。但是，假如ai与任何一个解释变量在任何时期都不相关，那么通过变化把ai消去就会导致低效的估计量。o如果假定非观测效应如果假定非观测效应ai与每一个解释变量与每一个解释变量都不相关都不相关o则上述模型就是一个随机效应(randome

23、ffects)模型。37如何估计o如果我们相信ai与解释变量不相关，则可用单一横截面回归(pooledOLS)得到的一致估计，根本不需要面板数据！但是使用单一横截面显然忽视了其他时期许多有用的信息。实际上，混合OLS回归通常是有偏误的。o定义复合误差项，则有o由于由于ai在每个时期都是复合误差项的一部分，在每个时期都是复合误差项的一部分，vit在在不同时间上就应是时序相关的不同时间上就应是时序相关的。38如何估计(续1)o因为，o所以，o必须用GLS变换以消去误差项中的时序相关。39如何估计(续2)o方程o定义o变换方程为：o固定效应估计量是从相应的变量减去时间平均，而随机效应变换只减去其时间

24、平均的一个分数随机效应变换只减去其时间平均的一个分数，这个分数依赖于和时期的个数T。40随机效应估计量的矩阵表达o复合误差项的方差协方差矩阵为o随机效应估计量为：41四种估计方法之比较四种估计方法之比较o这里的，即为前面的。42四种估计方法之比较(续)o当=0，得到混合OLS估计量；o当=1，得到固定效应估计量；o如果接近于0，随机效应估计量就会接近混合OLS估计量；如果接近于1，随机效应估计量就会接近固定效应估计量。当T很大时，趋于1，随机效应估计量与固定效应估计量非常相似。43求theta44随机效应模型的随机效应模型的Stata操作操作o（1）设定截面变量和时间变量）设定截面变量和时间变

25、量otsset panelvar timevaro（2）随机效应模型估计）随机效应模型估计oxtreg y x1 x2 x3, reo（3）得到得到(或或,theta)的值的值oxtreg y x1 x2 x3, re theta随机效应模型是否优于混合随机效应模型是否优于混合OLSo在在STATA中实施随机效应回归之后，使用中实施随机效应回归之后，使用xttest0，可以检验随机效应模型是否优于混合可以检验随机效应模型是否优于混合OLS 模型。模型。o本例中，本例中，P 值为值为0.0000，表明，表明RE优于混合优于混合OLS。4546五、模型设定检验五、模型设定检验o在实证分析中，选择固

26、定效应模型还是随机效应模在实证分析中，选择固定效应模型还是随机效应模型，一般通过型，一般通过Hausman检验来判断。检验来判断。o随机效应随机效应模型把个体效应模型把个体效应ai设定为随机扰动项的一设定为随机扰动项的一部分，所以就部分，所以就要求解释变量与个体效应要求解释变量与个体效应ai不相关不相关，而固定效应模型并不需要这个假设条件。而固定效应模型并不需要这个假设条件。o因此，可以通过检验该假设条件是否满足，来选择因此，可以通过检验该假设条件是否满足，来选择模型。如果满足，那么就应该采用随机效应模型，模型。如果满足，那么就应该采用随机效应模型，反之，就需要采用固定效应模型。反之，就需要采

27、用固定效应模型。47Hausman检验的原理检验的原理oHausman(1978)提出了一种基于随机效应估计量和提出了一种基于随机效应估计量和固定效应估计量之间差异的检验。固定效应估计量之间差异的检验。oHausman检验的基本思想是：检验的基本思想是：o在在个个体体效效应应ai和和其其他他解解释释变变量量不不相相关关的的原原假假设设下下，二者的参数估计应该不会有系统的差异二者的参数估计应该不会有系统的差异。o如如果果拒拒绝绝了了原原假假设设，则则认认为为ai与与解解释释变变量量出出现现了了相相关关，此此时时固固定定效效应应模模型型是是一一致致的的，而而随随机机效效应应模模型型是非一致的，我们

28、就应该选择固定效应模型。是非一致的，我们就应该选择固定效应模型。48关于Hausman检验的说明oHausman统计量为：统计量为：oH=(b-B)Var(b)-Var(B)-1(b-B)x2(k)ob为固定效应估计结果，为固定效应估计结果，B为随机效应估计结果。为随机效应估计结果。oHausman统计量服从自由度为统计量服从自由度为k的卡方分布。当的卡方分布。当H大于一定大于一定显著水平的临界值时，我们就认为模型中存在固定效应，显著水平的临界值时，我们就认为模型中存在固定效应，从而选用固定效应模型，否则选用随机效应模型。从而选用固定效应模型，否则选用随机效应模型。o如果如果Hausman检验

29、值为负，说明的模型设定有问题检验值为负，说明的模型设定有问题，导致，导致Hausman 检验的基本假设得不到满足，比如存在遗漏变量检验的基本假设得不到满足，比如存在遗漏变量的问题，或者某些变量是非平稳等等。的问题，或者某些变量是非平稳等等。o此时应改用此时应改用hausman检验的其他形式：检验的其他形式：ohausman fe, sigmaless49Hausman检验在检验在Stata中的操作中的操作o第一步：估计固定效应模型，存储结果第一步：估计固定效应模型，存储结果oxtreg y x1 x2 x3., fe oestimates store fixedo第二步：估计随机效应模型，存储

30、结果第二步：估计随机效应模型，存储结果oxtreg y x1 x2 x3., reoestimates store randomo第三步：进行第三步：进行hausman检验检验ohausman fixed random面板数据的面板数据的Stata操作实例操作实例o50(1)随机效应模型随机效应模型o首先采用随机效应方法来估计模型。数据集中有135个公司的3年数据，所以有405个样本观测值。但由于有缺失数据，最后得到的观测值为390个。o在STATA中输入：ouseJTRAINotssetfcodeyearoxtreghrsempd88d89grantgrant_1lemploy,re51随机

31、效应估计结果随机效应估计结果52随机效应估计结果分析o职业培训补助金（grant），其估计系数为33.52，且标准差比较小，估计量在统计上非常显著。因此，如果公司在当年得到补助金，与没有得到补助金相比，在其他条件不变下，公司会给其职员更多的（平均）培训时间33.52小时，这是很大的效果。o而上一年的职业培训补助金是不显著的，说明职业培训补助金没有滞后作用。o大公司是否比小公司提供更多的职业培训，从上述回归结果看：如果职员数量增加10%，每个职员的培训时间大约减少0.422小时，此结果统计上显著。53随机效应还是混合OLSo在随机效应回归后，输入xttest0，可得o表明，随机效应模型随机效应模

32、型优于混合优于混合OLS 模型模型。54随机效应回归的序列相关检验o在随机效应回归后，输入xttest1，可得55检验结果表检验结果表明，存在随明，存在随机效应和序机效应和序列相关，而列相关，而且，对随机且，对随机效应和序列效应和序列相关的联合相关的联合检验也非常检验也非常显著。显著。STATA命令下载安装o在STATA中，有些命令需要下载安装后才能使用，比如本例中的xttest1。o在STATA命令栏中输入osearch xttest1, neto按照提示下载并安装，然后才能使用。o该方法也适用于其他命令,如xttest2,xttest3,xtserial,等等。56(2)固定效应模型固定效

33、应模型o然后采用固定效应方法来估计模型。观测值与前述相同。o在STATA中输入：ouseJTRAINotssetfcodeyearoxtreghrsempd88d89grantgrant_1lemploy,fe57固定效应估计结果固定效应估计结果58固定效应估计结果分析o与随机效应估计相比，结果相差不大，仅ln(employ)的回归系数有所变化，由统计意义上的显著变为不显著。我们想了解的是大公司是否比小公司提供更多的职业培训，从上面回归结果中无法得到下面这个结论：如果职员数量增加10%，每个职员的培训时间大约减少0.176小时，因为估计结果在统计上非常不显著。59固定效应回归的异方差检验o在固

34、定效应回归之后，输入xttest3，检验截面的异方差。o本例中，检验结果意味着截面间存在异方差。60固定效应回归的序列相关检验oxtserial y x1 x2 x3o本例的检验结果是o意味着，误差项不存在一阶自相关。考虑到数据仅3年，这一结果是合理的。61(3)固定效应固定效应or随机效应随机效应o最后，我们在固定效应模型和随机效应模型中进行选择Hausman检验。如果检验统计量的P值不显著，用随机效应模型比较安全；而如果P值显著，则固定效应模型会更为合理。其STATA命令为：oxtreg hrsemp d88 d89 grant grant_1 lemploy, feoestimates

35、store fixedoxtreg hrsemp d88 d89 grant grant_1 lemploy, feoestimates store randomohausman fixed random62Hausman检验结果o检验结果的P值为0.6366，不显著，所以我们最后选择随机效应模型。63P值在值在10%以下，选择固定效应以下，选择固定效应64固定效应模型估计说明o固定效应模型中个体效应和随机干扰项的方差估计固定效应模型中个体效应和随机干扰项的方差估计值分别为值分别为sigma_u 和和sigma_e，二者之间的相关关，二者之间的相关关系为系为rho。o最后一行给出了检验固定效应

36、最后一行给出了检验固定效应u_i是否显著的是否显著的F统计统计量和相应的量和相应的P值（联合显著性检验，原假设：所有值（联合显著性检验，原假设：所有u_i都等于都等于0），本例中固定效应非常显著。），本例中固定效应非常显著。六、动态面板数据模型六、动态面板数据模型o很多经济关系本质上具有动态性，面板数据的优势之一就是它有助于更好地理解动态调整过程。o如Acemoglu等(2005)关于民主与教育之间动态关系的研究中(FromEducationtoDemocracy？)，就用到了动态面板数据模型。论文旨在反驳Lipset(1959)的现代化理论，后者认为，教育多半可以开阔人的视野，使他能理解宽容

37、准则的必要性，阻止他皈依极端主义学说，提高他在选举时作出合理选择的能力，也就是说，教育能够促进民主。作者用1965-2000年5年间隔的面板数据回归发现，教育对民主没有显著的效应。6566动态面板数据模型的一般形式o动态面板数据模型的一般形式：o在(1)式中，ui为非观测截面个体效应。o模型中含有滞后被解释变量，给估计带来难题。由于yit是ui的函数，显然yi,t-1也是ui的函数，因此(1)式右侧的回归解释变量yi,t-1就与误差项(ui+it)相关。o此时，采用混合OLS，估计量是有偏且不一致。o采取固定效应(FE)，组内变换后，仍无法解决内生性问题，结果同样是有偏且不一致。o采取随机效应

38、(RE)，结果也一样。(1)671、差分、差分GMM(DIF-GMM)oArellano和和Bond(1991)提出了DIF-GMM估计方法，通过对(1)式进行差分，消除未观测到的截面个体效应ui。o由(1)式知，yit-1是it-1的函数，因此(2)式中的o与是相关的。在估计(2)式时，就需引入的工具变量。(2)68DIF-GMM估计中的工具变量o从第3期开始，需要为yit-1设定工具变量。在DIF-GMM估计中，yit-1的工具变量是这样设定的：o在第3期，yi1是yi2的工具变量，因为它与(yi2-yi1)高度相关，而与(i3- i2)无关；o在第4期，yi1和yi2是yi3的工具变量；

39、o在第5期，yi1、yi2和yi3是yi4的工具变量；o依次类推。o外生解释变量同样作为工具变量。69DIF-GMM在在stata中的操作中的操作o1、估计。在设定面板数据完毕后，输入、估计。在设定面板数据完毕后，输入oxtabond y x1 x2 x3o2、检验。、检验。o（1）过度识别约束检验（检验工具变量是）过度识别约束检验（检验工具变量是否有效）否有效）oestat sargano（2）检验误差项的序列相关）检验误差项的序列相关(通常在做两步通常在做两步Arellano和和Bond估计之后才能进行估计之后才能进行)oestat abond702、系统、系统GMM(SYS-GMM)oD

40、IF-GMM存在着一些缺陷。比如，差分时，不仅消除了非观测截面个体效应，而且也消除了不随时间变化的其他变量。还有，DIF-GMM没有利用所有可用的矩条件，因而这种工具变量法可以得到模型参数的一致估计量，但很多时候并非有效估计量（方差最小）。oArellano和和Bover(1995)以及Blundell和和Bond(1998)在DIF-GMM估计的基础上，引入被解释变量差分的滞后项与随机误差项正交这个矩条件，得到SYS-GMM（系统GMM）。o参见Baltagi-Econometric Analysis of Panel Data71SYS-GMM在在stata中的操作中的操作o在对面板数据进

41、行设定之后，输入在对面板数据进行设定之后，输入oxtdpdsys y x1 x2 x3o过度识别约束检验过度识别约束检验oestat sargan72面板数据模型的面板数据模型的Stata操作操作o首先对面板数据进行声明：o前面是截面单元，后面是时间标识：otssetcompanyyearotssetindustryyearo产生新的变量：gennewvar=human*lnrdo产生滞后变量：genfiscal(2)=L2.fiscalo产生差分变量：genfiscal(D)=D.fiscal73描述性统计描述性统计oxtdes：对PanelData截面个数、时间跨度的整体描述oxtsum：

42、分组内、组间和样本整体计算各个变量的基本统计量oxttab采用列表的方式显示某个变量的分布回归回归xtregoStata中用于估计面板模型的主要命令：xtregoxtregdepvarvarlistifexp,model_typelevel(#)o简单总结：oxtreg y x1 x2 x3., fe oestimates store fixedoxtreg y x1 x2 x3., reoestimates store randomohausman fixed random 7475模型模型 Model typeobeBetween-effectsestimatorofeFixed-effe

43、ctsestimatororeGLSRandom-effectsestimatoropaGEEpopulation-averagedestimatoromleMaximum-likelihoodRandom-effectsestimator76主要估计方法主要估计方法oxtreg：Fixed-,between-andrandom-effects,andpopulation-averagedlinearmodelsoxtregar：Fixed-andrandom-effectslinearmodelswithanAR(1)disturbanceoxtpcse：OLSorPrais-Winsten

44、modelswithpanel-correctedstandarderrorsoxtrchh：Hildreth-Houckrandomcoefficientsmodelsoxtivreg：Instrumentalvariablesandtwo-stageleastsquaresforpanel-datamodels77oxtabond：Arellano-Bondlinear,dynamicpaneldataestimatoroxttobit：Random-effectstobitmodelsoxtlogit：Fixed-effects,random-effects,population-ave

45、ragedlogitmodelsoxtprobit：Random-effectsandpopulation-averagedprobitmodelsoxtfrontier：Stochasticfrontiermodelsforpanel-dataoxtrcgdpinvestcultureeduscihealthsocialadmin,beta78固定效应模型de检验o对于固定效应模型的异方差检验和序列相关检验：对于固定效应模型的异方差检验和序列相关检验：o序列相关检验：序列相关检验：oxtserial y x1 x2 x3 x4o异方差检验：异方差检验：oxtreg y x1 x2 x3 x4

46、, feoxttest3 (Modified Wald statistic for groupwise heteroskedasticity in fixed effect model)79随机效应模型de检验o随机效应模型的序列相关检验：随机效应模型的序列相关检验：oxtreg y x1 x2 x3 x4, reoxttest1oxttest1用于检验随机效应用于检验随机效应(单尾和双尾单尾和双尾) 、一阶序列、一阶序列相关以及两者的联合显著性。相关以及两者的联合显著性。80修正修正o可以使用广义线性模型可以使用广义线性模型xtgls对异方差和序列相关进行对异方差和序列相关进行修正：修正：o

47、xtgls y x1 x2 x3 x4(hetero)，修正异方差，修正异方差oxtgls y x1 x2 x3 x4, panels(correlated)，修正依横截面，修正依横截面而变化的异方差而变化的异方差oxtgls y x1 x2 x3 x4, panels(hetero) corr(ar1)，修正异方，修正异方差和一阶序列相关差和一阶序列相关ar(1)变系数模型变系数模型o面板数据变系数模型应用价值不大。o在变系数模型的估计中，一种方法是对每一个截面个体进行“分别回归”。更有效率的做法是，把所有个体回归方程叠放在一起(stack)，然后使用SUR(似不相关回归)对整个方程系统进行“系统回归”o另一种方法称为“随机系数模型”，用FGLS进行估计，即利用OLS残差来估计协方差矩阵的参数，然后再使用GLS。STATA命令是：oxtrc y x1 x2 x3, betaso(选择项betas表示，显示对每组系数的估计值)81

展开阅读全文

第11章 面板数据模型课件.ppt

最新文档

第11章面板数据模型课件.ppt