c13 跨时横截面的混合-简单面板数据分析方法1

上传人:飞*** 文档编号:43484714 上传时间:2018-06-06 格式:DOCX 页数:5 大小:661.38KB
返回 下载 相关 举报
c13 跨时横截面的混合-简单面板数据分析方法1_第1页
第1页 / 共5页
c13 跨时横截面的混合-简单面板数据分析方法1_第2页
第2页 / 共5页
c13 跨时横截面的混合-简单面板数据分析方法1_第3页
第3页 / 共5页
c13 跨时横截面的混合-简单面板数据分析方法1_第4页
第4页 / 共5页
c13 跨时横截面的混合-简单面板数据分析方法1_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《c13 跨时横截面的混合-简单面板数据分析方法1》由会员分享,可在线阅读,更多相关《c13 跨时横截面的混合-简单面板数据分析方法1(5页珍藏版)》请在金锄头文库上搜索。

1、第第 13 章章 跨时横截面的混合跨时横截面的混合-简单面板数据分析方法简单面板数据分析方法摘要: 本章引入两类数据,一类独立混合横截面数据(independently pooled cross section): 由 不同时点的两个随机独立抽取的横截面数据混合而成,保持独立性是该数据的一个特点。因此, 在保持其它条件不变,排除了误差项之间的相关性。不同时点,可能意味着总体分布已经发生了 变化,所以该类数据的分析可用于评价政策的变化。(13.1;13.2)另一类是面板数据(panel data)或者纵列数据(longitudinal data),该类数据通过对同一个横 截面数据的个体随时点的变

2、化进行跟踪,连续观察而得到。同一对象的不同时点观察,不能保证 这类数据的独立性。本章讨论面板数据分析较为简单的特殊模型和方法。13.1 跨时独立横截面的混合跨时独立横截面的混合使用独立混合横截面数据的一个理由是增加样本容量,并且若因变量和部分自变量保持不随 着时间而变化的关系,就可以得到更为精确的和更有功效的检验统计量。而为了反映总体分布随 时间变化的特征,就需要对模型进行改进:1)引入时间虚拟变量(例如,年度虚拟变量-year dummy variables),也就是允许截距 可以时变; 2)引入时间虚拟变量和某些自变量的交互效应,也就是允许斜率可以时变; 3)若误差项随时间而变时,仍可以使

3、用异方差-稳健的标准误和统计量或者 WLS。 跨时结构变化的邹至庄检验 在本节问题中,邹至庄检验检验的是跨时前后模型的结构是否发生了改变。此时,约束模型 的残差平方和可以通过基于混合后数据回归后计算,而无约束模型的残差平方和可以通过对两个 时期的数据分别回归后所得残差平方和加总得到。构造方法见 C7.4 和 C8.2(异方差-稳健的形式)。 构造邹至庄检验的另一种方法是,引入时间虚拟变量,并让其和所有(部分)自变量进行交互, 然后检验该虚拟变量和所有交互项是否联合显著的。 对多期的邹至庄检验,假定有 T 个时期和 k 个解释变量,那么约束模型中的待估参数为 k+T, 残差平方和记为,其 F 检

4、验的自由度为 n-k-T;而无约束模型的待估参数为 T(k+1),残差平方和为T 个时期分别做回归,回归后的残差平方和之和(),其 F 检验的自= 1+ 2+ + 由度为 n-T(k+1);如此可以得到 F 检验统计量:. = n - T(k + 1) ( 1)当然该检验对异方差不能保持稳健性。如果要得到异方差-稳健的检验还要回到使用交互项进行联 合检验的办法。13.2 利用混合横截面做政策分析利用混合横截面做政策分析混合横截面分析对于评价某一事件或者政策的影响可能非常重要。当某些外生事件(通常是政府的政策)改变了个人、家庭、企业或城市的运行环境时,就产生了自然实验(naturalnatura

5、l experimentexperiment)或者被称为准实验(quasi-experiment)。在一个自然实验中总有不受政策变化影响的对照组(control group)和受政策改变影响的处理组(treatment group),不同于真实实验(true experiment)的 是自然实验的这两个组的划分依据是是否受所研究的政策影响,而真实实验中则通过随机的方式 确定。为了控制好这两个组之间的系统差异,我们需要政策变化前后的两年数据。如此实际样本 可分为四个组:政策变化前的年份 d2=0政策变化后的年份 d2=1对照组 (C) dT=0(dT=0,d2=0)(dT=0,d2=1)处理组(

6、T)dT=1 (dT=1,d2=0)(dT=1,d2=1)则我们感兴趣的变量为:. = 0+ 02 + 1 + 12 + 其它因素控制了政策效应,在没有其它因素的时候,就是倍差估计量(difference-indifferencesdifference-indifferences11estimatorestimator),见下表的含义:了解1政策变化前的年份政策变化后的年份后减去前对照组00+ 00处理组0+ 1 +0+ 1+ 01+01处理组减去对照组1 +111由上表可知,或者,这就是倍差的1=(2, 2,)(1, 1,)1=(2, 1,)(2, 1,)来源。由于倍差估计用 y 的平均值来

7、处理政策效应,因此也被称为平均处理效应(averageaverage 1treatmenttreatment effecteffect).如果模型中包含了其它控制变量,那么没有上面两种简洁的估计式,但其含义类似。1例子 13.3 垃圾焚化炉的区位对住房的价格的影响 Nearinc 这个虚拟变量将样本分为住房靠近垃圾焚化炉的样本组(处理组)和远离垃圾焚化炉的 样本组(对照组),例如以 3 英里为线划分。焚化炉是在 81 年动工的,所以选取了 1978 年和 1981 年两个年份的数据。实证结果如下表:13.3 两期面板数据的分析如果对一横截面数据中的个体,进行连续两期的观测,那就得到了两期面板数

8、据。对于面板 数据,我们可以从误差项中分离出随时间不变的不可观测因素 ,一般被称为为非观测效应(unobservedunobserved effecteffect)或者固定效应(fixedfixed effecteffect),即因个体而异但随时间固定的不可观测因素的综合效应,或者被称为非观测异质性(unobservedunobserved heterogeneityheterogeneity). 从误差项中分离出随时间变化但不随个体变化的不可观测因素可以由时间虚拟变量来刻画。在面板数据分析中,误差项会随着个体和时间而变,从而其被称为特质误差(idiosyncraticidiosyncrati

9、c errorerror) 或时变误差(time-time-varyingvarying errorerror),并记为。这样,一个两年份的面板数据模型可以表示为:,, t=1,2,= 0+ 0 + 11,+ + ,+ + ,是时间虚拟变量,当 t=2,取值为 1,否则为 0;常被称为复合误差(compositecomposite ,= + ,errorerror).对上述模型有两种估计方法,一是:直接把两期的数据混合起来,也就是以为扰动项进行,OLS 估计,但这需要一个前提,那就是自变量和不相关。若相关了,所得估计是有偏的和不一,致的。这种偏误被称为异质性偏误(heterogeneityhe

10、terogeneity biasbias)。由于 的存在,不相关的假设很难得到保证。也正因为考虑到非观测效应 和解释变量的相关性,我们才引入面板数据分析。另一种估计方法是差分法,即由于非观测效应 时不变,所以将两期方程做差就能消去该因素,所得差分方程被称为一阶差分方程(first-differencedfirst-differenced equationequation):, ,2 ,1= 0+ 1(1,2 1,1)+ + (,2 ,1)+ ,2 ,1或者.= 0+ 1,1+ + ,+ 这种估计方法需要要求和(j=1,2,k)不相关,而只要每个时期的误差项和所有时期自变量不相关(严格外生性假设

11、,strictstrict exogeneityexogeneity assumptionassumption),这个条件就满足了。该估计方法的估计量被称为一阶差分估计量(first-differencedfirst-differenced estimatorestimator).上述估计的另一个要求是满足MLR.3,就是必须随时间有所变化。如此,我们一般就可以假设一阶差分模型满足CLM或者高斯-马尔科夫假设。所建立的估计量和统计量也就不会有问题。 一阶差分法的代价是减少了x的变异,有时这会造成严重的问题;二是减少了样本量,而为获 得面板数据,可能需要付出较高的代价。 面板数据的数据结构 通常

12、用两个变量来标示一个样本,一个是个体变量(例如,city),另一个是时期变量(例如, year)。见下表:13.4 用两期面板数据作政策分析面板数据可用于政策分析,特别是项目评价。在一个最简单的项目评价案例中,第一时期得 到有关个体、企业、城市等单位的一个样本;然后让其中的部分横截面单位(处理组)参与一个期间 内举办的某个项目,其余单位作为对照组;最后,取得第二个时期的样本。记为项目参与的虚拟变量,为第二个时期的虚拟变量,则最简单的不可观测效应模prog,2型为:+,= 0+ 02+ 1prog,+ ,如果项目参与仅发生在第二个时期,那么该差分方程中的就有一个非常简单的表达式(倍差估计):1,

13、1= 不同于混合横截面数据的是,此时允许个体固定效应的存在,并通过差分对该效应加以控制。项目参与如两期发生,没有上述明显的含义但是其意义不变即代表因项目参与所致的y的平1均值变化;引入随时间而变化的因素,特别是那些和项目参与相关的随时间变化的自变量,也不会影响的意义。113.5 多期面板数据的差分法如果 N 个横截面单位中,都有 T 期的数据,则该数据被称为平衡面板数据(balanced panel data ). 基于平衡面板数据的一个 T 期模型如下:,t=1,2,3,T,= 0+ 22+ + + 11,+ + ,+ + ,为时期虚拟变量,是当期取值为1,否则取值为0.我们对这T个方程进行

14、连环差分,即第二2,期的减去第一期,第三期的减去第二期的,共得到T-1个差分方程:,t=2,3,T,= 22+ + + 11,+ + ,+ ,由于该方程没有截距项,其的一个等价方程为:,t=2,3,T. (13.1) ,= 0+ 33+ + + 11,+ + ,+ ,要估计(13.1) 式需要进一步的假设. 假设1:严格外生性假设,即,j=1,2,.k,s=1,2,T;(,) = 0假设2:是时变的,其实要求满足MLR.3;1,假设3: 是序列无关的。,假设3并不总成立,事实上即使原序列不相关,也并不意味着其差分序列不相关。下面介绍一 个检验是序列无关的方法:,Step1: 估计(13.1)得到残差序列;,Step2: 建立,并进行回归,t=3,T;,=

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 研究报告 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号