金融计量经济学第6章 面板数据分析

上传人:suns****4568 文档编号:88912195 上传时间:2019-05-13 格式:PDF 页数:14 大小:501.42KB
返回 下载 相关 举报
金融计量经济学第6章 面板数据分析_第1页
第1页 / 共14页
金融计量经济学第6章 面板数据分析_第2页
第2页 / 共14页
金融计量经济学第6章 面板数据分析_第3页
第3页 / 共14页
金融计量经济学第6章 面板数据分析_第4页
第4页 / 共14页
金融计量经济学第6章 面板数据分析_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《金融计量经济学第6章 面板数据分析》由会员分享,可在线阅读,更多相关《金融计量经济学第6章 面板数据分析(14页珍藏版)》请在金锄头文库上搜索。

1、北京大学光华管理学院 金融计量经济学讲义 161 第三部分第三部分 面板数据的回归分析面板数据的回归分析 第第六六章章 面板数据的多元回归分析面板数据的多元回归分析 6 61 1 引言引言 在前面的讨论中都是针对数据来源于横截面,每一个样本是独立地来源于不同的单元, 样本的选取具有假设 1 需要的随机性。 在实际的数据采集时, 有时可能会对相同的单元在不 同的时间点得到多个样本,例如对家庭收入的调查,对公司 CEO 特征的选取等。实际中大 部分的抽样数据可能在每年是随机选取的,但在不同的年份可能会选取到相同的家庭或公 司,甚至有时调查的对象也是固定的。此时数据就不完全是横截面的,而是某些单元或

2、所有 的单元都具有时间序列数据。 如此得到的数据显然容易违背独立观测样本的要求。 而独立观 测样本是横截面数据的一个很重要的特征, 它可以排除不同观测样本之间存在相关性。 但是, 当抽样的总体比较大时,如此抽取的样本也是独立抽样,从统计的角度来看,这类数据还具 有一个重要的特征:它们是独立的样本观测值,这也是横截面数据分析的一个重要方面,这 一定程度上保证了不同观测样本的误差项之间没有相关性。 这类数据通常被称为联合横截面 数据。 联合横截面数据与简单的横截面数据的差别在于因为其在不同时间点的抽样可能导致 观测值不是同分布的。 这些对同一单元在不同时间点得到的数据可能会导致观测值之间存在 相关

3、性;更为重用的是,在不同时间点的样本可能具有不同的分布,例如一个国家的教育水 平或收入水平在不同的年份会有变化, 公司在不同时期的收益水平可能是不同的。 在分析中 可能需要考虑时间趋势的变量,可以引入不同时间点的变量来考察是否存在改变等。 面板数据是联合横截面数据中的一种特殊情形。此时,不仅是某些单元有重复,而是所 有单元都有相同的时间点重复, 可以看作是在横截面和时间序列两个维度上都有数据, 所有 的样本数据构成了时间和空间两个方向上的一个矩阵。 为了得到面板数据, 需要在任何一个 抽样的时间点都对相同的一组单元(个人,家庭,公司,城市)进行采样。例如,对个人收 入,教育年限,其他特征等的一

4、个抽样是在开始的时间点随机选取一组人群,在随后的每一 次再调查时,都要对这一组人群的每一个进行调查,得到这一组人群多年的相关数据。对面 板数据来说, 假设样本观测值在不同时间点是独立同分布显然不现实。 一些不可观测的因素 可能会对某些单元有固定的影响。例如一个公司的 CEO 可能会因为与公司的特殊关系和其 他原因而在每一年都有相对比较高的收入; 一些地区可能会因为社会文化和环境而具有特定 的影响一个地区的经济发展指标, 或其他产出率等。 这种在各时间点都存在的对一个单元的 共同因素的影响效果称为固定效应。 在后面关于面板数据分析的方法中就是要克服这类对个 体单元的共同影响因素带来的模型估计偏差

5、。 6 62 2 联合横截面数据的回归分析联合横截面数据的回归分析 621 联合横截面数据联合横截面数据 联合横截面数据可以很快地增大样本量,使得估计的结果更准确,检验的功效更高。采 用联合横截面回归分析基本没有增加计量技术的复杂程度。 在同时涉及到横截面和时间序列 的数据中,有的单元数据并没有在所有时间点都有。例如,由于人口的迁移而使收入调查的 部分样本缺少一些时间点; 在公司的数据方面也同样由新公司上市或经营不善公司退出市场 等原因而不能使每个单元都具有所有的时间点的数据。 在对两个或两个以上时间点的样本选 择时,如果也是具有随机选取的特征,可以直接使用横截面的分析方法。例如前后两年的调

6、北京大学光华管理学院 金融计量经济学讲义 162 查数据都是独立进行的, 这类数据虽然由于存在同一单元多个时间点数据而可能不满足独立 选取样本的条件或使样本具有一定的时间特性, 但通过联合横截面的方式, 可以进行通常的 回归分析。 如果不同时期之间的影响不存在, 直接把联合横截面数据看成横截面数据进行回 归分析即可。 如果在两个或多个时间点的数据之间可能存在水平的漂移 (例如在两个不同年 份收入的调查) ,可以通过加入时间虚拟变量来控制这一影响而得到合理的回归分析结果。 有时, 时间虚拟变量的系数就是研究者所关注的问题, 通过这一系数可以反应在不同时间点 的差异。 还可以通过年份虚拟变量与某些

7、变量的乘积项来考察该变量在不同年份的影响。 例如教 育水平在不同年份带来的收益可能是不同的, 性别在不同时代的教育收益差别可能也是不同 的。为此我们可以通过加入年份虚拟变量与教育和性别的乘积的模型来考查: femalyfemale unionerereducyeducywage 85 expexp8585)log( 55 4 2 321100 模型中 1978 年的截距项是 0 ,1985 年的截距项是 00 ;1978 年的教育收益是 1 , 1985 年的教育收益是 11 , 1 刻画了通过 7 年以后,每年的教育收益的改变量;在 1978 年男女之间的收入增产差异是 5 ,到 1985

8、年时,男女之间的收入增产差异是 55 。我 们可以检验在这 7 年间男女的收入差异没有变化的零假设为0: 50 H,备择假设为 0: 51 H; 为分析直观起见, 模型中假设了在两个时期工作经验和是否工会组织成员对收 入的影响相同。 在进行模型估计之前还要考虑两个时期收入的通货膨胀率影响, 要使用相应 的物价指数对两个时期的收入进行调整。代入相关数据得到估计模型为: ereducyeducywageexp0296. 0850185. 00747. 085118. 0459. 0)log( (0.093) (0.124) (0.0067) (0.0094) (0.0036) eryfemaleu

9、nionerexp85085. 0317. 00202. 0exp0004. 0 2 (0.00008) (0.030) (0.037) (0.051) n=1084, 426. 0 2 R, 422. 0. 2 RAdj。 1978 年的教育收益是 7.5%,1985 年的教育收益是 9.35%,比 1978 年高了 1.85%;两个 时期差异的 t 统计量是 1.85/0.94=1.97, 两个时期的教育收益差异在 5%的双边检验是显著的。 1978 年女性比男性的收入要低 31.7%,到 1985 年降低到 23.2%,两个时期的性别差异降低 了 8.5%,两个时期差异的 t 统计量是

10、8.5/5.1=1.67,在 5%的单边检验是显著的。 如果对模型中的每一个系数都使用与年虚拟变量的乘积, 就相当于分别对两年的数据进 行回归。当不同时间点之间数据的差异不仅是水平的漂移,还可能有方差的不同时,就需要 使用更复杂的方法,后面会对此进行专门的讨论。 622 结构改变的结构改变的 Chow 检验检验 联合横截面数据是否可以直接进行回归, 在不同的时段上横截面是否一致或可以看成是 一致的,可以通过一个 F 检验来考察。假定只有两个时期的数据,限制模型可以直接通过 对所有样本进行联合横截面回归而得到残差平方和 SSR; 完全模型是分别对两个时期的数据 进行横截面回归而分别得到残差平方和

11、 SSR1 和 SSR2,二者之和即为总的无限制模型残差 平方和。 在两个时期的时候, 也可以通过对其中一年的样本在每一变量都使用年虚拟变量乘 积项, 对年虚拟变量和交叉乘积项进行联合显著性检验也可以给出所要的结果。 这一检验方 北京大学光华管理学院 金融计量经济学讲义 163 法还可以只对其中的一部分变量(怀疑具有差异可能性比较大)使用交叉项,可以提高检验 的功效。 面对多时期的数据时, 同样可以考虑具有不同的截距项, 也可以考虑其中的一些变量具 有不同的斜率项系数。 要想回答这一问题, 可以通过使用虚拟变量的乘积项来考察斜率系数 是否在不同时期发生了改变。回归的模型中,除了基准年外,其他的

12、年变量都要与其中的一 个变量, 几个变量或全部变量进行乘积而加入到模型中。 对加入模型中的乘积项检验它们的 联合显著性就可以回答所要的结论。 当样本中包含很多时期的数据时, 这一方法就会显得比 较繁琐。 假定有 T 个时期的数据,此时的限制模型可以直接通过对所有样本进行联合横截面回 归,允许各年的数据具有不同的截距项,得到残差平方和为 SSR;完全模型是分别对 T 个 时期的数据进行横截面回归而分别得到 T 个模型的残差平方和为 T SSRSSRSSR, 21 。这 T 个残差平方之和即为总的无限制模型残差平方和 Tu SSRSSRSSRSSR 21 。假定 模型中考虑了 k 个解释变量,则在

13、检验中加入的约束条件为kT) 1( 个,在无限制模型中 需要估计的参数是) 1( kT个。假定每个时期的样本量分别为: T nnn, 21 ,总的样本量 为 T nnnn 21 ,检验统计量为: SSR SSRSSR kT kTn F u ) 1( ) 1( (6.1) 则有检验统计量 F 服从自由度分别为kT) 1(和) 1( kTn的 F 分布。 这一 F 检验只能对模型系数在不同时期之间是否存在差异进行检验。当不同时期之间 存在异方差时,检验结果不稳健,具有比较低的功效。 623 联合横截面数据的策略分析联合横截面数据的策略分析 联合横截面数据可以用来分析事件或策略的影响。 可以通过一个

14、事件发生前后收集的数 据来反映事件的影响。例如要分析一个公益设施、一条轨道交通、一个垃圾处理站的建立对 周边地区房价的影响。 考虑一个垃圾处理站的建立, 可以通过这一设施建立前后两年附近地 区及其他地区的数据来给出。假定调查到的数据是 1999 年和 2002 年,房价用 rprice 表示, 使用简单回归模型,一个小区是否接近这一垃圾处理站使用虚拟变量 nearl,只使用 2002 年 的数据得到简单回归模型为: 2002 年:nearlrprice069. 3131.10 1999 年:nearlrprice882. 1252. 8 (0.3093) (0.5828) (0.2654) (

15、0.5828) n=142, 165. 0 2 R n=179, 082. 0 2 R。 模型中的截距项表示不在垃圾处理站附件房子的平均价格,nearl 的系数是垃圾处理站 附近与其他地区平均房价的差异,这一估计系数的 t 统计量超过了 5,是非常显著的,似乎 有很强的证据拒绝两个地区的房价有差异。假若我们只使用 1999 年的数据进行同样的回归 模型, 得到简单回归模型, 结果显示在垃圾处理站建立之前两个地区的房价差异也是非常显 著的。按照常识,人们也会认为垃圾处理站会建立在比较偏僻,或房价比较低的地区,在未 建立处理站前, 这一地区的房价也是低的。 而我们在此需要回答的是建立垃圾处理站是否影 响了这一地区的房价。在两个时期,两个地区房价的差异是:-3.069-(-1.882)=-1.187。为了 得到这一差异是否显著,还需要得到它的标准差,为此可以通过回归模型来实现,模型为: nearlynearlyrprice0202 1100 。使用两个时期的数据代入模型进行估 北京大学光华管理学院 金融计量经济学讲义 164 计可以得到所感兴趣的乘积项系数 1 是否显著需要的标准差,估计的结果列于表 61 中, 表中的第一列表示只使用虚拟

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号