单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,第八章 面板数据模型电子课件计量经济学,第八章 面板数据模型,8.1,面板数据模型概述,时间序列数据或截面数据都是一维数据,而面板数据(Panel Data)是同时在时间和截面空间上取得的二维数据与一般的混合横截面时间序列数据不同,面板数据是对多个不同个体在不同时期的观测伴随着经济理论、计算机技术、统计方法和数据采集技术的发展,Panel Data得到了越来越广泛的应用面板数据用双下标变量表示例如:,8.1,面板数据模型概述,面板数据可以根据个体维度和时间维度的大小分为两种类型:(1)N大T小,一般称短面板,常见于各种微观调查数据;(2)N小T大,一般称长面板,常见于宏观数据面板数据因同时含有时间序列数据和截面数据,所以其统计性质既带有时间序列的性质,又包含一定的横截面数据特点因此,以往采用的计量模型和估计方法就需要有所调整。
用面板数据建立的模型通常有3种,即:混合(pool)估计模型、固定效应模型和随机效应模型模型(8.1.1)常用的有如下三种情形:,8.1,面板数据模型概述,对于情形1,称为无个体影响的不变系数模型,其在横截面上无个体影响、无结构变化,可由普通最小二乘法估计给出a和b的一致有效估计,即相当于多个时期的截面数据放在一起作为样本数据对于情形2,称为变截距模型,由于在横截面上存在个体影响,而不存在结构性的变化,同时又考虑到个体差异影响是否在模型中被忽略,因此还可将模型进一步分为固定效应影响和随机效应影响两种情况对于情形3,称为变系数模型,除了存在个体影响外,在横截面上还存在结构变化,因此结构参数在不同横截面单位上是不同的8.1,面板数据模型概述,8.1.1 混合估计模型,如果从时间上看,不同个体之间不存在显著性差异;从截面上看,不同时间之间也不存在显著性差异,那么就可以直接把面板数据混合在一起用普通最小二乘法(OLS)估计参数混合估计模型的特点是对每个截面和时间,和均相同8.1.2 固定效应模型,8.1,面板数据模型概述,8.1.3 随机效应模型,8.2,固定效应回归,固定效应模型中有 个虚拟变量系数和 个解释变量系数需要估计,因此总共有 个参数需要估计。
当不是很大时,可直接采用普通最小二乘法进行估计但是当 很大时,直接使用 方法的计算量就变得非常大,甚至有可能超过计算机的存储容量8.2,固定效应回归,式(,8.2.1,)减去各截面时间上的均值,即组内均值,可得:,得出:,该估计方法也称为最小二乘虚拟变量(,Least-Squares Dummy-Variable,LSDV,)估计8.3,随机效应回归,8.4,检验和不同设定,面板数据模型设定时,必须考虑样本数据在个体间的差异(异质性),时间上的变化(时变性),以及各可观测影响因素(即各解释变量)的效应变化(系数的改变性)就线性回归模型而言,理论上通常划分为两类:一类具有相同斜率系数的模型,即不变系数模型;另一类是变系数模型对不变系数模型还要检验截距是否相同8.4.1,模型选择的检验,通常使用协方差分析检验,主要检验如下两个假设:,对面板数据模型(8.1.1)有三种类型的约束条件,分别是:,由于斜率不相等时讨论截距是否相等意义不大,故一般不考虑模型(8.4.2)对应的约束类型8.4,检验和不同设定,8.4.1,模型选择的检验,可以使用约束回归检验的,F,统计量来检验在参数约束成立下,,8.4,检验和不同设定,8.4.2,固定效应和随机效应的,Hausman,检验,通过比较固定效应变截距模型:,和随机效应变截距模型:,8.4,检验和不同设定,8.4.2,固定效应和随机效应的,Hausman,检验,Hausman,构造,Wald,统计量,W,:,8.5,应用,例,8.5.1,酒精税和交通事故死亡率,在美国每年有,4,万起高速公路交通事故,约,1/3,涉及酒后驾车。
这个比率在饮酒高峰期会上升在凌晨,1,点,-3,点期间,有,25%,的司机饮酒,而饮酒司机发生交通事故的次数是不饮酒司机的,13,倍现有,1982-1988,年,48,个州共计,336,组美国公路交通事故死亡人数与啤酒税的数据本案例研究酒精税和关于酒后驾车的法律规定对交通死亡事故的影响使用,stata16,打开在目录“,D:stata16shujuchap08,”中的“,0801.dta,”数据文件,命令如下:,use,“,D:stata16shujuchap080801.dta”,clear,然后对横截面观测值变量和时间序列观测值变量进行定义生成面板序列在,Command,界面输入如下命令:,xtset state year/*,注意区分面板数据和时间序列数据有关变量序列的设定,*/,上述命令含义为定义,state,为横截面观测值变量,,year,为时间序列观测值变量8.5,应用,(,1,),混合估计模型的估计,由于混合估计模型的原理依旧是最小二乘法,因此在,Command,界面输入回归命令:,regress mrall beertax,Enter,键确认后得到结果:,图,8.5.1,混合估计模型的估计,8.5,应用,(,2,),固定效应模型的估计,固定效应模型主要进行组内估计,在,Command,界面输入固定效应模型回归命令为:,xtreg mrall beertax,fe,其中,“,fe”,是“,fixed effects”,的缩写,表示固定效应估计量。
estimates store fe/*,为了后面分析方便,将固定效应的结果进行储存,*/,Enter,键确认后得到结果:,图,8.5.2,固定效应模型的估计,8.5,应用,上表中,第一、二行为常规的回归结果输出表,第三行表示扰动项的标准差,其中,sigma_u,表示个体效应标准差,,rho,是指个体效应的方差占比混合误差方差本例中,,rho=0.93,,故混合扰动项的方差主要来自于个体效应的变动最后表底,F,检验表示对,48,个州的个体差异的总体,F,检验结果表明,至少在某些个体之间存在着差异3,)随机效应模型的估计,从固定效应模型的回归结果中,可以看出个体效应的存在但个体效应也可能以随机效应形式存在,为此我们需要对随机效应模型进行回归在,Command,界面输入命令:,xtreg mrall beertax,re,estimates store re,Enter,键确认后得到结果:,图,8.5.3,随机效应模型的估计,8.5,应用,由于样本数据在个体间的差异、时间上的变化,使得面板数据模型形式的设定具有不确定性因此根据前面理论知识可知,常用的有两种检验方法,分别为,F,检验和豪斯曼检验。
其中,,F,检验针对斜率和截距都相同或斜率相同和截距不同进行检验;而豪斯曼检验是针对斜率相同和截距不同的变截距固定系数模型检验,进而确定是固定效应还是随机效应下面通过例子在,Stata,中的操作予以检验和解释第一种是对面板数据利用,F,检验,由于,Stata,中没有直接用于求解,F,统计量的命令,下面以公式的构造进行分步骤求解首先,对,F,3,统计量中的三个回归残差平方和进行计算:,第一步,计算模型(,8.1.1,)估计的残差平方和,S,1,,分别对不同地区进行时间序列回归,得到各个回归残差平方和,然后进行加权求和在,Command,窗口输入如下命令:,sort state/*,按照地区进行排序,*/,statsby _b _se e(residuals),by(state)saving(D:stata16shujuchap08080101.dta,replace):regress mrall beertax,其中,,statsby,表示分组回归的命令,能将每一组所回归的数据置于一张表中,,_b,、,_se,分别表示回归后的系数和对应的标准误,,by(state),是指按照区域进行分组回归,,saving(),表示前面生成变量所存储的位置,最后是所要进行的回归。
注意:,regress mrall beertax,是连着前面:的8.5,应用,Enter,键后,回归系数估计及标准误和残差保存于,080101.dta,中,,stata,结果显示:,这里有一段被删除,由于目的是为了对各个体的残差平方进行计算求和,思路是现根据估计参数进行计算拟合值,然后实际值减去拟合值,从而得到残差,最后对残差进行平方求和在,Stata,中的,command,窗口中输入如下命令,:,merge m:1 state using“D:stata16shujuchap08080101.dta”/*,将分组回归的结果合并到原始数据文件中,同时注意路径是英文下双引号,*/,gen mhat=_b_cons+_b_beertax*beertax/*mhat,是回归预测值,该步是进行拟合值拟合,*/,gen resid=mrall-mhat,egen SSR=sum(resid2)/*,对所有残差平方和进行求和,*/,Enter,键后,可见数据编辑器中有,S1,(,SSR,)的求解结果:,8.5,应用,图,8.5.4,分组回归残差平方结果,8.5,应用,从上图中计算可知,各个分组回归的残差平方和即,S,1,的值为,6.35e-08,。
第二步,计算模型(,8.4.1,)估计的残差平方和,S,2,,由于模型(,8.4.1,)所表明的是变截距的固定效应模型,则对应的残差平方和即为图,8.5.2,所对应的结果,通过在,command,中进行数据标识,其命令为:,xtreg mrall beertax,fe,predict e2,r,egen rss2=sum(e22),计算结果显示,S,2,=1.784e-06,第三步,计算模型(,8.4.3,)估计的残差平方和,S,3,由于截距和系数都是不变的,即为混合回归模型,则对应的残差平方和即为图,8.5.1,所对应的结果通过在,command,中进行数据标识,其命令为:,regress mrall beertax,predict u2,r,egen rss3=sum(u22),计算结果显示,S,3,=9.875e-07,8.5,应用,第四步,根据式,(,8.4.5,),和,(,8.4.6,),中,F1,和,F3,统计量的公式进行计算,(,N=48,T=7,K=1,),,在,Command,中输入如下命令为:,di F1=(rss2-SSR)*240/(SSR*47),di F3=(rss3-SSR)*240/(SSR*47*2),enter,键后得如下结果:,接下来,我们从如何进行软件操作的角度,介绍豪斯曼检验的软件操作。
假设使用的模型是变截距固定系数模型从图,8.5.3,最后一行的,rho,结果来看,rho=0.881,,个体效应也可能以随机效应的形式存在,那么是使用固定效应还是随机效应,还需要进行豪斯曼检验8.5,应用,可以利用前面已经储存了相应的估计结果,fe,和,re,,或者重新再估计一下,然后进行豪斯曼检验在,Command,界面输入命令:,xtreg mrall beertax,fe,estimates store fe,xtreg mrall beertax,re,estimates store re,hausman fe re,constant sigmamore,图,8.5.5,豪斯曼检验结果,从上述图8.5.4的结果可以发现,P值接近于0,即个体效应与解释变量不相关,所以应该认为是固定效应,而不是随机效应8.5,应用,例,8.5.2,我国城镇居民消费模型,(1)模型设定,根据经典模型中关于消费函数模型的讨论,以城镇居民人均消费支出为被。