《面板数据分析方法》由会员分享,可在线阅读,更多相关《面板数据分析方法(85页珍藏版)》请在金锄头文库上搜索。
1、面板数据分析方法面板数据分析方法Baltagi Baltagi著著 白仲林主译白仲林主译第一节第一节 面板数据的基本问题面板数据的基本问题第二节第二节 面板数据的模型形式面板数据的模型形式第三节第三节 面板数据模型的估计方法面板数据模型的估计方法第一节第一节 面板数据的基本问题面板数据的基本问题 一、面板数据的定义一、面板数据的定义二、面板数据的分类二、面板数据的分类三、面板数据的特点三、面板数据的特点一、面板数据的定义一、面板数据的定义 面板数据面板数据(panel data)是指由变量)是指由变量y关于关于N个不个不同对象的同对象的T个观测期所得到的二维结构数据,记为个观测期所得到的二维结
2、构数据,记为yit,其中,其中,i表示表示N个不同对象(如国家、地区、行业、企个不同对象(如国家、地区、行业、企业或消费者等,一般称之为第业或消费者等,一般称之为第i个个体),个个体),t表示表示T个观个观测期。测期。面板数据是二维结构数据面板数据是二维结构数据 时间序列数据或截面数据都是一维数据。时间序列时间序列数据或截面数据都是一维数据。时间序列数据是变量按时间得到的数据;截面数据是变量在固定数据是变量按时间得到的数据;截面数据是变量在固定时点的一组数据。时点的一组数据。面板数据是同时在时间和截面上取得面板数据是同时在时间和截面上取得的二维数据。的二维数据。所以所以 ,面板数据,面板数据(
3、panel data)也称作时间也称作时间序列与截面混合数据序列与截面混合数据(pooled time series and cross section data)。面板数据是截面上个体在不同时点的重。面板数据是截面上个体在不同时点的重复观测数据。复观测数据。面板数据是二维结构数据面板数据是二维结构数据 Panel原指对一组固定调查对象的多次观测,近年原指对一组固定调查对象的多次观测,近年来来panel data已经成为专业术语。已经成为专业术语。 面板数据从横截面看面板数据从横截面看(cross section),是由若干个体,是由若干个体(entity,unit,individual)在某
4、一时点构成的截面观测值,在某一时点构成的截面观测值,从纵剖面从纵剖面(longitudinal section)看每个个体都是一个时间看每个个体都是一个时间序列。序列。数据结构的二维性数据结构的二维性时间序列数据横截面数据变量变量X的面板数据结构的面板数据结构面板数据是二维结构数据面板数据是二维结构数据第一节第一节 面板数据的基本问题面板数据的基本问题 一、面板数据的定义一、面板数据的定义二、面板数据的分类二、面板数据的分类三、面板数据的特点三、面板数据的特点二、面板数据的分类二、面板数据的分类 1.1.短面板与长面板短面板与长面板 短面板短面板(short panel):时间:时间T较小,而
5、个体数较小,而个体数N较大。较大。 长面板长面板(long panel):时间:时间T较大,而个体数较大,而个体数N较小。较小。二、面板数据的分类二、面板数据的分类 2.2.微观面板数据与宏观面板数据微观面板数据与宏观面板数据 微微观观面面板板数数据据一一般般指指一一段段时时期期内内不不同同个个体体或或者者家家庭庭的的调调查查数数据据,其其数数据据中中往往往往个个体体单单位位较较多多,即即N较较大大(通通常常均均为为几几百百或或上上千千)而而时时期期数数T较较短短(最最短短为为两两个个时期,最长一般不超过时期,最长一般不超过20个时期)。个时期)。二、面板数据的分类二、面板数据的分类 2.2.
6、微观面板数据与宏观面板数据微观面板数据与宏观面板数据 宏宏观观面面板板数数据据通通常常为为一一段段时时间间内内不不同同国国家家或或地地区区的的数数据据集集合合,其其个个体体单单位位数数量量N不不大大(一一般般为为7-200)而而时时期数期数T较长(一般为较长(一般为20-60年)。年)。二、面板数据的分类二、面板数据的分类 3.3.动态面板与静态面板动态面板与静态面板 在面板模型中,如果解释变量包含被解释变量的滞在面板模型中,如果解释变量包含被解释变量的滞后值,则称为后值,则称为“动态面板动态面板”(dynamic panel);反之,;反之,则称为则称为“静态面板静态面板”(static p
7、anel)。二、面板数据的分类二、面板数据的分类 4.4.平衡面板数据与非平衡面板数据平衡面板数据与非平衡面板数据 如如果果在在面面板板数数据据中中,每每个个时时期期在在样样本本中中的的个个体体完完全全一一样样,则则称称为为“平平衡衡面面板板数数据据”(balanced panel);然然而而,有有时时某某些些个个体体的的数数据据可可能能缺缺失失,或或者者新新的的个个体体后后来来才才加加入入到到调调查查中中来来,在在这这种种情情况况下下,每每个个时时期期观观测测到到的的个个体体不不完完全全相相同同,则则称称为为“非非平平衡衡面面板板数数据据”(unbalanced panel)。第一节第一节
8、面板数据的基本问题面板数据的基本问题 一、面板数据的定义一、面板数据的定义二、面板数据的分类二、面板数据的分类三、面板数据的特点三、面板数据的特点三、面板数据的特点三、面板数据的特点 1.由于观测值的增多,可以增加估计量的抽样精度。由于观测值的增多,可以增加估计量的抽样精度。 由由于于同同时时有有截截面面维维度度与与时时间间维维度度,通通常常面面板板数数据据的的样本容量更大,从而可以提高估计的精确度。样本容量更大,从而可以提高估计的精确度。 面面板板数数据据提提供供“更更加加有有信信息息价价值值的的数数据据,变变量量增增加加变变异异性性,变变量量之之间间的的共共线线性性削削弱弱了了,并并且且提
9、提高高了了自自由由度度和有效性。和有效性。三、面板数据的特点三、面板数据的特点 2.提供更多个体动态行为的信息。提供更多个体动态行为的信息。 由由于于面面板板数数据据同同时时有有横横截截面面与与时时间间两两个个维维度度,有有时时可可以以解解决决单单独独的的截截面面数数据据或或时时间间序序列列数数据据所所不不能能解解决决的的问问题题,对对面面板板数数据据进进行行回回归归既既可可以以像像回回归归分分析析截截面面数数据据一一样样捕捕获获个个体体间间的的差差异异变变化化,又又可可以以研研究究个个体体随随时时间间的的变化情况。变化情况。三、面板数据的特点三、面板数据的特点 2.提供更多个体动态行为的信息
10、。提供更多个体动态行为的信息。 案案例例:考考虑虑如如何何区区分分规规模模效效应应与与技技术术进进步步对对企企业业生生产产效效率率的的影影响响。对对于于截截面面数数据据来来说说,由由于于没没有有时时间间维维度度,故故无无法法观观测测到到技技术术进进步步。然然而而,对对于于单单个个企企业业的的时时间间序序列列数数据据来来说说,我我们们无无法法区区分分其其生生产产效效率率的的提提高高究究竟竟有有多多少少是由于规模扩大,有多少是由于技术进步。是由于规模扩大,有多少是由于技术进步。 三、面板数据的特点三、面板数据的特点 3.可以解决遗漏变量问题。可以解决遗漏变量问题。 遗遗漏漏变变量量偏偏差差是是一一
11、个个普普遍遍存存在在的的问问题题。虽虽然然可可以以用用工工具具变变量量法法解解决决,但但有有效效的的工工具具变变量量常常常常很很难难找找。遗遗漏漏变变量量常常常常是是由由于于不不可可观观测测的的个个体体差差异异或或“异异质质性性”造造成成的的,如如果果这这种种个个体体差差异异“不不随随时时间间而而改改变变”,则则面面板板数数据提供了解决遗漏变量问题的又一利器。据提供了解决遗漏变量问题的又一利器。三、面板数据的特点三、面板数据的特点 4.带来一些问题。带来一些问题。 (1)由由于于综综合合了了两两种种数数据据类类型型,面面板板数数据据分分析析方方法法相相对对更加复杂。更加复杂。 (2)由由于于同
12、同一一个个体体不不同同时时期期的的数数据据一一般般存存在在自自相相关关,样样本数据通常不满足独立同分布的假定。本数据通常不满足独立同分布的假定。 (3)面板数据的收集成本通常较高,不易获得。)面板数据的收集成本通常较高,不易获得。图图图图6 6 图图图图7 7FileFile:5panel02a5panel02a用原变量建模还是用对数变量建模用原变量建模还是用对数变量建模? ?人均消费对收入的面板数据散点图人均消费对收入的面板数据散点图人均消费对收入的面板数据散点图人均消费对收入的面板数据散点图 对数的人均消费对收入的面板数据散点图对数的人均消费对收入的面板数据散点图对数的人均消费对收入的面板
13、数据散点图对数的人均消费对收入的面板数据散点图本例用对数数据研究更合理本例用对数数据研究更合理本例用对数数据研究更合理本例用对数数据研究更合理 图图图图8 8 图图图图9 9尽管两个地区的水平值差异很大,但消费结构并没有太大的变化。尽管两个地区的水平值差异很大,但消费结构并没有太大的变化。尽管两个地区的水平值差异很大,但消费结构并没有太大的变化。尽管两个地区的水平值差异很大,但消费结构并没有太大的变化。第一节第一节 面板数据的基本问题面板数据的基本问题第二节第二节 面板数据的模型形式面板数据的模型形式第三节第三节 面板数据模型的估计方法面板数据模型的估计方法其中:其中: 和和 分别表示居民的消
14、费与收入。分别表示居民的消费与收入。 反映不随时间变化的个体上的差异性反映不随时间变化的个体上的差异性(个体效应)(个体效应) 反映不随个体变化的时间上的差异性反映不随个体变化的时间上的差异性(时间效应)(时间效应)例例1:居民消费行为与收入的关系:居民消费行为与收入的关系 例例2. 农村居民收入分析农村居民收入分析 (14.1.3)(14.1.3) 面板数据:多个观测对象的时间序列数据所组成的样本数据。 反映不随个体变化的时间上的差异性, 被称为时间效应。 反映不随时间变化的个体上的差异性, 被称为个体效应第二节第二节 面板数据的模型形式面板数据的模型形式 一、个体效应模型一、个体效应模型二
15、、固定效应模型二、固定效应模型三、随机效应模型三、随机效应模型四、双向效应模型四、双向效应模型其中:其中: 为为 的矩阵,的矩阵, 为为k个解释变量的第个解释变量的第i个个体在个个体在 第第t时期的观测值,为时期的观测值,为 的矩阵。的矩阵。zi为不随时间为不随时间 而变的个体特征,即而变的个体特征,即 。扰动项由。扰动项由 两部分构成,被称为两部分构成,被称为“复合扰动项复合扰动项”。 个体效应模型个体效应模型(individual-specific effects model)假定假定样本中每个个体的回归方程斜率相同,但截距项不同。样本中每个个体的回归方程斜率相同,但截距项不同。一、个体效
16、应模型一、个体效应模型复合扰动项:复合扰动项:不可观测的随机变量不可观测的随机变量 是代表个体异质性的截距项。是代表个体异质性的截距项。 为随个体与时间而变的扰动项。为随个体与时间而变的扰动项。假定假定 为独立同分布的,且与为独立同分布的,且与 不相关。不相关。 个体效应模型个体效应模型1.它表示不可观测的个体特殊效应、潜在变量、不可观测它表示不可观测的个体特殊效应、潜在变量、不可观测 的异质性等。考虑到个人或者任一家庭、企业都具有很的异质性等。考虑到个人或者任一家庭、企业都具有很 难被调查者观察到的独有的特征,这种特殊效应在整个难被调查者观察到的独有的特征,这种特殊效应在整个 时间范围内时间
17、范围内 是保持不变的。是保持不变的。2.某些场合下将其视为常数,但这也是随机变量的特例,某些场合下将其视为常数,但这也是随机变量的特例, 即退化的随机变量。即退化的随机变量。 对于个体效应对于个体效应 :取对数后,模型变为:取对数后,模型变为:在这里,在这里, 代表着企业不随时间变化并且不可观测到的代表着企业不随时间变化并且不可观测到的特殊效应,它表示一个企业的管理才能、员工素质等。特殊效应,它表示一个企业的管理才能、员工素质等。例:一个企业的柯布例:一个企业的柯布-道格拉斯生产函数道格拉斯生产函数1.如果如果 与所有解释变量与所有解释变量 均不相关,则进一步称之均不相关,则进一步称之 为为“
18、随机效应模型随机效应模型”(Random Effects Model,RE)。2.如果如果 与某个解释变量相关,则进一步称之为与某个解释变量相关,则进一步称之为“固定效固定效 应模型应模型(Fixed Effects Model,FE)。个体效应个体效应 与解释变量与解释变量 的相关性:的相关性:第二节第二节 面板数据的模型形式面板数据的模型形式 一、个体效应模型一、个体效应模型二、固定效应模型二、固定效应模型三、随机效应模型三、随机效应模型四、双向效应模型四、双向效应模型 固定效应模型形式同样与个体效应模型相同,但是在固定效应模型形式同样与个体效应模型相同,但是在固定效应模型中假定固定效应模
19、型中假定 为需要估计的固定参数,它可以为需要估计的固定参数,它可以与解释变量之间存在相关性。与解释变量之间存在相关性。 固定效应模型意味着存在内生解释变量。在固定效应模型意味着存在内生解释变量。在 随随时间变化的情况下,固定效应模型所得到的第时间变化的情况下,固定效应模型所得到的第j个解释个解释变量的边际效应估计量同样是一致的。然而,同随机效变量的边际效应估计量同样是一致的。然而,同随机效应模型相比,固定效应应模型相比,固定效应 模型中存在参数过多和自由度损模型中存在参数过多和自由度损失过多等问题。失过多等问题。二、固定效应模型二、固定效应模型第二节第二节 面板数据的模型形式面板数据的模型形式
20、 一、个体效应模型一、个体效应模型二、固定效应模型二、固定效应模型三、随机效应模型三、随机效应模型四、双向效应模型四、双向效应模型 对于随机效应模型,一般采用可行的广义最小二乘法对于随机效应模型,一般采用可行的广义最小二乘法(FGLS)对其进行估计,由于对其进行估计,由于 被假定为随机的,无须估被假定为随机的,无须估计,计, 因此使用随机效应模型可以一次得到所有系数的估因此使用随机效应模型可以一次得到所有系数的估计值从而进行边际分析。但是,如果随机效应模型选取计值从而进行边际分析。但是,如果随机效应模型选取不恰当所得到的参数估计值将是不一致的。不恰当所得到的参数估计值将是不一致的。 随机效应模
21、型形式与个体效应模型相同,在随机效应随机效应模型形式与个体效应模型相同,在随机效应模型中假定模型中假定 是完全随机的,即是完全随机的,即 与解释变量无关。与解释变量无关。三、随机效应模型三、随机效应模型第二节第二节 面板数据的模型形式面板数据的模型形式 一、个体效应模型一、个体效应模型二、固定效应模型二、固定效应模型三、随机效应模型三、随机效应模型四、双向效应模型四、双向效应模型 双向效应模型双向效应模型(two-way-effects model)也可称为双因也可称为双因素误差模型,它将未观测到的个体效应和时间效应引入素误差模型,它将未观测到的个体效应和时间效应引入模型,是个体效应模型的标准
22、延伸。模型,是个体效应模型的标准延伸。这里这里t t仅随时间变化而不随个体变化,表示所有未包仅随时间变化而不随个体变化,表示所有未包含在回归模型中的发生在特定时期的影响,如地震对某含在回归模型中的发生在特定时期的影响,如地震对某一时期企业生产的影响。一时期企业生产的影响。四、双向效应模型四、双向效应模型双向固定效双向固定效应模型模型(Two-way FE)对于短面板数据,通常将时间效应看做固定效应,如果个对于短面板数据,通常将时间效应看做固定效应,如果个体效应模型中含有时间趋势项或包含时间虚拟变量,则称体效应模型中含有时间趋势项或包含时间虚拟变量,则称之为双向固定效应模型。之为双向固定效应模型
23、。(1)在固定效应模型中引入时间趋势项)在固定效应模型中引入时间趋势项t,它仅依时间,它仅依时间而变化,而不依个体而变。而变化,而不依个体而变。(2)对每个时期定义一个虚拟变量,然后把)对每个时期定义一个虚拟变量,然后把(T-1)个时间个时间虚拟变量包括在回归方程中(未包括的时间虚拟变量即虚拟变量包括在回归方程中(未包括的时间虚拟变量即为基期)。为基期)。第一节第一节 面板数据的基本问题面板数据的基本问题第二节第二节 面板数据的模型形式面板数据的模型形式第三节第三节 面板数据模型的估计方法面板数据模型的估计方法第三节第三节 面板数据模型的估计方法面板数据模型的估计方法 一、混合最小二乘估计一、
24、混合最小二乘估计二、固定效应模型的估计方法二、固定效应模型的估计方法三、随机效应模型的估计方法三、随机效应模型的估计方法一、混合最小二乘估计一、混合最小二乘估计(Pooled OLS)假定所有个体都拥有完全一样的回归方程:假定所有个体都拥有完全一样的回归方程:其中,其中,xit不包括常数项,这样,就可以直接把所有数据不包括常数项,这样,就可以直接把所有数据放在一起,像对待横截面数据那样进行放在一起,像对待横截面数据那样进行OLS回归,故被回归,故被称为称为“混合回归混合回归”(pooled OLS)。人均消费对人均可支人均消费对人均可支配收入的弹性系数是配收入的弹性系数是0.9694。人均消费
25、对人均可支人均消费对人均可支配收入的边际系数是配收入的边际系数是0.9694 CPit /IPit对案例案例1人均消人均消费CP与收入与收入IP的面板数据的面板数据进行混合估行混合估计:注意:注意:1.由于面板数据的特点,虽然通常可以假设不同个体之由于面板数据的特点,虽然通常可以假设不同个体之间的扰动项相互独立,但同一个体在不同时期的扰动项间的扰动项相互独立,但同一个体在不同时期的扰动项之间往往存在自相关。此时,对标准差的估计应该使用之间往往存在自相关。此时,对标准差的估计应该使用聚类稳健的标准差聚类稳健的标准差(cluster-robust standard error),而所,而所谓聚类就
26、是由每个个体不同时期的所有观测值所组成。谓聚类就是由每个个体不同时期的所有观测值所组成。同一聚类(个体)的观测值允许存在相关性,而不同聚同一聚类(个体)的观测值允许存在相关性,而不同聚类(个体)的观测值则不相关。类(个体)的观测值则不相关。注意:注意:2.混合回归的基本假设是不存在个体效应。对于这个假混合回归的基本假设是不存在个体效应。对于这个假设必须进行统计检验。由于个体效应以两种不同的形态设必须进行统计检验。由于个体效应以两种不同的形态存在(即随机效应与固定效应),因此需要分别对其进存在(即随机效应与固定效应),因此需要分别对其进行检验。行检验。第三节第三节 面板数据模型的估计方法面板数据
27、模型的估计方法 一、混合最小二乘估计一、混合最小二乘估计二、固定效应模型的估计方法二、固定效应模型的估计方法三、随机效应模型的估计方法三、随机效应模型的估计方法二、固定效应模型的估计方法二、固定效应模型的估计方法对于固定效应模型:对于固定效应模型:由于由于 被假定为需要估计的固定参数并允许与解释变被假定为需要估计的固定参数并允许与解释变量相关,因此,估计固定效应模型中的系数量相关,因此,估计固定效应模型中的系数 时便可以时便可以考虑通过变换模型形式从而消除这一不可观测到的个体考虑通过变换模型形式从而消除这一不可观测到的个体效应。效应。二、固定效应模型的估计方法二、固定效应模型的估计方法(一)组
28、内估计(一)组内估计 对于固定效应模型,给定第对于固定效应模型,给定第i个个体,将方程个个体,将方程 两边对时间取平均可得两边对时间取平均可得 用原模型减去平均后的方程,可得其离差形式:用原模型减去平均后的方程,可得其离差形式:二、固定效应模型的估计方法二、固定效应模型的估计方法定义定义则则由于上式中已将由于上式中已将 消去,故只要消去,故只要 与与 不相关,则可不相关,则可以用以用OLS一致地估计一致地估计 ,称为,称为“固定效应估计量固定效应估计量”(Fixed Effects Estimator),记为,记为 。由于其主要使用了。由于其主要使用了每个个体的组内离差信息,故也称为每个个体的
29、组内离差信息,故也称为“组内估计量组内估计量”(within estimator)。 注意:注意: 即使个体特征即使个体特征 与解释变量与解释变量 相关,只要使用组相关,只要使用组内估计量,就可以得到一致估计,但在作离差转换的过内估计量,就可以得到一致估计,但在作离差转换的过程中,程中, 也被消掉了,故无法估计也被消掉了,故无法估计 。即。即 无法估计无法估计不随时间而变的变量的影响。不随时间而变的变量的影响。注意:注意: 另外,为了保证另外,为了保证 与与 不相关,则要不相关,则要求第求第i个观测值满足严格外生性,即个观测值满足严格外生性,即 ,因为因为 中包含了所有中包含了所有 的信息。换
30、言之,扰的信息。换言之,扰动项必须与各期的解释变量均不相关(而不仅仅是当期动项必须与各期的解释变量均不相关(而不仅仅是当期的解释变量),这是一个比较强的假定。的解释变量),这是一个比较强的假定。二、固定效应模型的估计方法二、固定效应模型的估计方法(二)最小二乘虚拟变量模型(二)最小二乘虚拟变量模型(LSDV) 对于固定效应模型:对于固定效应模型: 在方程中引入在方程中引入(n-1)个虚拟变量(如果没有截距项,则个虚拟变量(如果没有截距项,则引入引入n个虚拟变量)来代表不同的个体,则可以得到与个虚拟变量)来代表不同的个体,则可以得到与上述离差模型同样的结果,称为上述离差模型同样的结果,称为“最小
31、二乘虚拟变量模最小二乘虚拟变量模型型”(Least Square Dummy Variable Model)。虚虚拟变量回量回归的特点的特点 使用使用LSDV方法所给出的估计值,与我们用组内估方法所给出的估计值,与我们用组内估计方法得到的估计值恰好一样,而且标准误和其他主计方法得到的估计值恰好一样,而且标准误和其他主要统计量也是一样。因此,固定效应估计量可以从虚要统计量也是一样。因此,固定效应估计量可以从虚拟变量回归得到。拟变量回归得到。 从从LSDV方法算出的可决系数的值通常都比较高,方法算出的可决系数的值通常都比较高,这是因为我们对每一横截面单位都包含了一个虚拟变这是因为我们对每一横截面单
32、位都包含了一个虚拟变量,以致能解释数据中的变异的大部分。量,以致能解释数据中的变异的大部分。从结果看,北京、上海、浙江是自发消费(消费函数截距)最大的3个地区。 注意:注意: 使用使用LSDV方法虽然可以得到对个体异质性方法虽然可以得到对个体异质性 的的估计,但是会损失很大的自由度,并在估计估计,但是会损失很大的自由度,并在估计(n-1)个额外个额外的参数时,大量的虚拟变量会加剧回归方程的多重共线的参数时,大量的虚拟变量会加剧回归方程的多重共线性问题,也不能估计非时变性问题,也不能估计非时变(time-constant)变量效应。变量效应。 此外,此外,LSDV方法也不能解决内生性问题。方法也
33、不能解决内生性问题。LSDV的估的估计效果效果 Islam(2000)运运用用蒙蒙特特卡卡罗罗模模拟拟研研究究了了一一些些关关于于经经济济增增长长收收敛敛方方面面的的面面板板数数据据估估计计。研研究究发发现现,如如果果以以小小样样本本偏偏差差和和预预测测误误差差的的标标准准方方差差来来判判断断的的话话,LSDV估估计计在在小小样样本本上上的的估估计计结结果果最最好好,其其估估计计效效果果甚至比甚至比GMM估计和工具变量估计和工具变量(IV)估计都更好。估计都更好。 Islam (2000)对此提供的一种理论解释是,对此提供的一种理论解释是,GMM和和IV估计在小样本上估计效果不好的原因是因为,
34、这估计在小样本上估计效果不好的原因是因为,这两种方法的优点都依赖于回归估计中所能选择到的最两种方法的优点都依赖于回归估计中所能选择到的最优权重矩阵,而这一权重在回归中可能会收到数据噪优权重矩阵,而这一权重在回归中可能会收到数据噪声。声。 LSDV的估的估计效果效果二、固定效应模型的估计方法二、固定效应模型的估计方法(三)一阶差分法(三)一阶差分法 对于固定效应模型,给定第对于固定效应模型,给定第i个个体,将方程个个体,将方程 两边进行一阶差分,以消去个体效应,得两边进行一阶差分,以消去个体效应,得 对上述差分形式的方程使用对上述差分形式的方程使用OLS就可以得到就可以得到“一阶差一阶差分分估计
35、量估计量”,记为,记为 。组内估计量与一阶差分估计量组内估计量与一阶差分估计量由于由于 不再出现在差分方程中,只要扰动项的一阶差分不再出现在差分方程中,只要扰动项的一阶差分 与解释变量的一阶差分与解释变量的一阶差分 不相关,则不相关,则 是一致的。此一致性条件比保证是一致的。此一致性条件比保证 一致的严格外生一致的严格外生性假定更弱,这是性假定更弱,这是 的主要优点。的主要优点。组内估计量与一阶差分估计量组内估计量与一阶差分估计量 组内估计和一阶差分都假设不可观测的个体效应与组内估计和一阶差分都假设不可观测的个体效应与解释变量相关,两种估计方法在解释变量相关,两种估计方法在T=2时产生相同的估
36、计时产生相同的估计量和推断。当总体时期量和推断。当总体时期T2时,在时,在 序列不相关,独立序列不相关,独立同分布的情况下,组内估计量同分布的情况下,组内估计量 比一阶差分估计量比一阶差分估计量 更有效率。因此,在实践上,主要使用更有效率。因此,在实践上,主要使用 ,而较少用,而较少用第三节第三节 面板数据模型的估计方法面板数据模型的估计方法 一、混合最小二乘估计一、混合最小二乘估计二、固定效应模型的估计方法二、固定效应模型的估计方法三、随机效应模型的估计方法三、随机效应模型的估计方法三、随机效应模型的估计方法三、随机效应模型的估计方法对于回归方程:对于回归方程:随机效应模型假定随机效应模型假
37、定 与解释变量与解释变量 均不相关,故均不相关,故OLS是一致的。然而,由于扰动项由是一致的。然而,由于扰动项由 组成,不是组成,不是球型扰动项(同方差、无自相关),因此,球型扰动项(同方差、无自相关),因此,OLS不是最不是最有效率的。有效率的。由于由于 的存在,同一个体不同时期的扰动项之间存在自的存在,同一个体不同时期的扰动项之间存在自相关,相关,具体来说,用具体来说,用OLS来估计以下来估计以下“广义离差广义离差” (quasi-demeaned)模型,模型,组间估计组间估计(Between Estimator)究竟该用固定效应还是随机效应模型?究竟该用固定效应还是随机效应模型? 当当我
38、我们们在在日日常常研研究究中中选选取取模模型型形形式式时时,不不能能确确定定未未观观测测到到的的个个体体效效应应是是否否与与解解释释变变量量相相关关,因因而而不不能能恰恰当当地地在在固固定定效效应应模模型型和和随随机机效效应应模模型型之之间间进进行行选选取取。错错误误选选取取模模型型类类型型,将将影影响响我我们们的的参参数数估估计计量量等等从从而而影影响响对对具具体体问问题题的的分分析析。在在处处理理面面板板数数据据时时,究究竟竟该该使用固定效应模型还是随机效应模型是一个根本问题。使用固定效应模型还是随机效应模型是一个根本问题。Hausman检验检验原假设原假设H0: 与与 不相关(模型应设定
39、为随机效应)不相关(模型应设定为随机效应) 备择假设备择假设H1: 与与 相关(模型设定为固定效应)相关(模型设定为固定效应) Hausman检验统计量:检验统计量: 固定效应模型与随机效应模型哪个更好一些?固定效应模型与随机效应模型哪个更好一些? 随随机机效效应应模模型型的的好好处处是是节节省省自自由由度度。对对于于从从时时间间和和截截面面两两方方面面看看都都存存在在较较大大变变化化的的数数据据,随随机机效效应应模模型能明确地描述出误差来源的特征。型能明确地描述出误差来源的特征。 固固定定效效应应模模型型的的好好处处是是,很很容容易易分分析析任任意意截截面面数数据据所所对对应应的的应应变变量
40、量与与全全部部截截面面数数据据对对应应的的因因变变量量均均值值的差异程度。的差异程度。Wooldridge(2000) 在在实实际际应应用用时时,是是选选择择固固定定效效应应模模型型还还是是选选择择随随机机效效应应模模型型?一一般般的的经经验验的的做做法法是是,如如果果研研究究者者预预期期建建立立面面板板数数据据模模型型推推断断样样本本空空间间的的经经济济关关系系,则则模模型型设设定定为为固固定定效效应应模模型型会会更更合合理理一一些些。否否则则,如如果果研研究究样样本本是是从从总总体体随随机机抽抽样样得得到到的的,并并且且预预期期利利用用模模型型解解释释或或推推断断总总体体的的统统计计性性质
41、质,则则将将模模型型设设定定为为随随机机效效应应模型比较合理。模型比较合理。古扎拉蒂(古扎拉蒂(2013)1.如如果果T(观观测测的的时时间间点点的的数数目目)较较大大,且且N(横横截截面面单单元元的的数数量量)较较小小,则则通通过过固固定定效效应应模模型型和和随随机机效效应应模模型型估估计计的的参参数数值值之之间间很很可可能能没没什什么么差差别别。这这时时的的选选择择依依据据就就是是基基于于计计算算上上的的便便利利了了。在在这这种种情情况况下下,固固定定效应模型可能更加可取。效应模型可能更加可取。古扎拉蒂(古扎拉蒂(2013)2.在在短短面面板板(N大大且且T小小)中中,两两种种方方法法的的
42、估估计计值值可可能能有有显显著著差差别别。如如果果我我们们确确信信样样本本中中横横截截面面单单元元不不是是从从一一个个较较大大的的样样本本中中随随机机抽抽取取的的,那那么么固固定定效效应应模模型型是是可可取取的的。如如果果不不是是这这种种情情况况,统统计计推推断断是是无无条条件件的的,则则随机效应模型是可取的。随机效应模型是可取的。古扎拉蒂(古扎拉蒂(2013)3.如如果果N较较大大而而T较较小小,并并且且随随机机效效应应模模型型的的假假设设成成立立,那那么么随随机机效效应应模模型型的的估估计计量量比比固固定定效效应应模模型型的的估估计计量量更加有效。更加有效。古扎拉蒂(古扎拉蒂(2013)4
43、.与与固固定定效效应应模模型型不不同同,随随机机效效应应模模型型可可以以估估计计时时间间不不变变性性变变量量的的系系数数,比比如如性性别别和和种种族族这这类类变变量量。固固定定效效应应模模型型确确实实可可以以控控制制住住这这些些时时间间不不变变性性变变量量,但但是是它它不不能能直直接接估估计计这这些些变变量量,这这一一点点从从LSDV估估计计模模型型中中可可以以清清楚楚地地得得出出。另另一一方方面面,固固定定效效应应模模型型可可以以控控制制住住所所有有时时间间不不变变性性变变量量,而而随随机机效效应应模模型型只只能能控控制制住住那那些些在模型中可以被精确表达的时间不变性变量。在模型中可以被精确
44、表达的时间不变性变量。各种估计量的性质各种估计量的性质 1.混合估计:混合估计: 如如果果斜斜率率系系数数在在所所有有主主体体间间是是不不变变的的,而而且且误误差差项项与与解解释释变变量量无无关关,那那么么混混合合估估计计就就是是一一致致的的。但但是是,对对一一个个给给定定的的个个体体而而言言,误误差差项项在在时时间间上上很很可可能能相相关关。所所有有,我我们们必必须须使使用用面面板板修修正正标标准准误误来来进进行行假假设设检检验验。否则,一般计算得出的标准误可能会被低估。否则,一般计算得出的标准误可能会被低估。各种估计量的性质各种估计量的性质 2.固定效应估计:固定效应估计: 即即使使潜潜在在的的模模型型是是混混合合或或随随机机效效应应模模型型,固固定定效效应模型也总是一致的。应模型也总是一致的。 3.随机效应估计:随机效应估计: 即即使使真真实实的的模模型型是是混混合合的的,随随机机效效应应模模型型也也是是一一致致的的。但但是是如如果果真真实实的的模模型型是是固固定定效效应应的的,那那么么随随机效应模型将是不一致的。机效应模型将是不一致的。