混合截面数据

上传人:小** 文档编号:64095845 上传时间:2018-12-26 格式:PPT 页数:14 大小:200.50KB
返回 下载 相关 举报
混合截面数据_第1页
第1页 / 共14页
混合截面数据_第2页
第2页 / 共14页
混合截面数据_第3页
第3页 / 共14页
混合截面数据_第4页
第4页 / 共14页
混合截面数据_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《混合截面数据》由会员分享,可在线阅读,更多相关《混合截面数据(14页珍藏版)》请在金锄头文库上搜索。

1、混合截面数据,independently pooled cross section,什么是混合截面数据,是横截面数据和时间序列并存的二维空间 在不同时点,从一个大总体里进行多次随机抽样 把不同时点抽取的随机样本合并起来就构成了一个独立混合截面数据 在每一个时点上进行的都是随机抽样,所以混合截面数据是由独立抽取的观测值构成,为我们使用OLS回归提供方便(也是与综列数据的区别),为什么要使用混合截面数据,加大样本量,提供更加精密的估计量 通常将不同年份的横截面数据混合在一起,能较好的分析一项新政策的影响 能让我们看到一个关键的变量如何随时间的变化而改变,使用时可能遇到的问题及解决办法,因为数据都是

2、随机抽样,处理混合截面数据的方法和处理横截面数据很相似,许多处理横截面数据的方法都能够用来处理混合截面数据。但以下的几点与处理横截面数据的区别仍需注意:,使用时可能遇到的问题及解决办法,Q: 混合在一起的不同时点的数据应该被“一视 同仁”么? A: 我们在处理横截面数据时会认为样本中的每一个数据对最终结果的作用都是相同的。而在混合截面数据中,因为受到时间的影响,不同时点上抽样的数据可能对最终回归的结果产生不同的影响,所以不同时点但混合在一起数据在进行OLS时不能“一视同仁”,而需要增加时间虚拟变量。,使用时可能遇到的问题及解决办法,解决办法:加入时间虚拟变量(dummy) Kids=+*y(t

3、ime) +*X+u 通常,会设定最早的一年是基期 公式中的y(time)是观测期。如果数据属于观测期的样本,则y(time)=1,否则为0 这样就通过调整截距来控制不同时点观测到的数据对因变量的影响问题,使用时可能遇到的问题及解决办法,我们可以把时间虚拟变量也看成是一个控制变量,在去控制了时间对于因变量的影响后,我们就能够对不同时点观测到的数据心安理得的用横截面的方法分析 或者我们把它看成是控制了其他可观测因素后的这段时间里被解释变量会出现什么变化,例子中的解释的就是在观测期到基期这段时间里,控制住其他变量后,妇女生育的变化,使用时可能遇到的问题及解决办法,Q:如果不单纯的考虑时间变化对因变

4、量的影响,而是想考虑某些解释变量对因变量的作用在一段时期里是否发生了变化,应该如何调整解释变量与时间虚拟变量的关系呢? A:通常用时间虚拟变量和想要了解的解释变量的交互作用来解决。在pooled data里主要是时间虚拟变量,而在其他类型的数据中也可以用其他虚拟变量和想要解释的变量做交互。 解决方法:设交互项,使用时可能遇到的问题及解决办法,wage= +0*y(time)+1*educ+1*y(time)*educ+u 其中,0是时间对于工资的影响 1是基期的解释变量对因变量的影响 1(difference-in-differences estimator) 是多受一年教育的回报经过从基期到

5、观测期这段时间变化了多少,应用实例,美国某市要兴建一座垃圾焚化炉(1978-1981) 需要检验的假设是:靠近垃圾焚化炉的房价要比远离焚化炉房价低 方程1:rprice=0+1*nearinc+u nearine为虚拟变量,靠近(3公里以内)为1,否则为0 代入1981年的数据会得到: rprice=101307.5-30688.27nearinc (3093.0)(5827.71),应用实例,把1978年的数据代入方程,则会得到rprice=82517.23-18824.37nearinc (2653.79)(5827.71) 说明在修建焚化炉之前,靠近焚化炉位置的房价就要低于远离焚化炉位置

6、的房价,因此直接用1981年的数据并不能说明新建焚化炉会压低房价 应该将实施政策前两地房价的差从政策对房价的影响中扣除 实际的影响=-30688.27-(-18824.37)=-11863.9=1 Rprice=0+0y81+1nearinc+1y81*nearinc+u,应用实例,总的说来,我们在应用时,可以通过回归得出1的估计量 Y=+0*d2+1*dB+1d2*dB+other factors 或用1 =(y2,B-y2,A)-(y1,B-y1,A)来度量政策的效果 其中y表示平均,第一个下标表示年,第二个下表表示组,使用时可能遇到的问题及解决办法,还需要注意的问题: 所找的抽样用的总体应该足够大,否则在不同时点随机抽样时会很容易抽到许多相同的样本点,使混合截面数据出现综列数据的某些特征。 所估计的方程也可能会产生误差项的异方差问题(BP检验),可通过OLS估计后产生的异方差的解决办法(WLS),只要把时间虚拟变量像其他解释变量一样放进方程就可以,谢 谢,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号