面板数据模型卢二坡第一节 面板数据模型简介n一、数据的类型nCross-sectional: observations on a number of agents/firms in moment in timenTime series: observations taken at intervals over timenPooled cross-section: randomly selected observations taken in each time periodnPanel data: Observations on same cross- section of individuals over timen例如1990-2000年30个省份的农业总产值数据 固定在某一年份上,它是由30个农业总产总 值数字组成的截面数据;固定在某一省份上, 它是由11年农业总产值数据组成的一个时间序 列面板数据由30个个体组成共有330个观 测值n对于面板数据 ,如果从横截面上看,每个变量 都有观测值,从纵剖面上看,每一期都有观测 值,则称此面板数据为平衡面板数据( balanced panel data)。
若在面板数据中丢失 若干个观测值,则称此面板数据为非平衡面板 数据(unbalanced panel data)n二、面板数据模型特点:nPanel Data分析的作用体现在:n (1)控制个体行为差异 n Panel Data数据库显示个体(包括个人、企业、地区或国家)之间存 在差异,而单独的时间序列和横截面不能有效反映这种差异如果只是 简单使用时间序列和横截面分析就可能获得有偏结果此外,Panel Data分析能够控制在时间序列和横截面研究中不能控制的涉及地区和时 间为常数的情况也就是说,当个体在时间或地区分布中存在着常数的 变量(例如受教育程度、电视广告等)时,如果在模型中不考虑这些变 量,有可能会得到有偏结果Panel Data分析能够控制时间或地区分布 中的恒变量,而普通时间序列和横截面研究中则不能n (2)Panel Data能够提供更多信息、更多变化性、更少共线性、更多 自由度和更高效率反观时间序列经常受多重共线性的困扰n (3)Panel Data能够更好地研究动态调节,横截面分布看上去相对稳 定但却隐藏了许多变化,Panel Data由于包含较长时间,能够弄清诸如 经济政策变化对失业状况的影响等问题。
n (4)Panel Data能更好地识别和度量纯时间序列和纯横截面数据所不 能发现的影响因素n (5)相对于纯横截面和纯时间序列数据而言,Panel Data能够构造和 检验更复杂的行为模型第二节 一般面板数据模型介绍第三节 固定效应模型估计方法组内组第四节 随机效应模型及其估计方法组内组间第四节 模型的设定检验n1. Pooled OLS vs. Panel2.Hausman检验(Random vs Fixed effects model)第五节 面板数据模型的stata实现n例:我国29个地区 1991~2003年居民消费( cs)和城镇人均可支配收入(yd)数据n年份:year(1991-2003)nIdentity: idntsset id year;n/*pooled ols vs random effects*/;nreg cs yd;nxtreg cs yd, re;nxttest0;/*BP test*/;n/*random vs fixed */;nxtreg cs yd ,fe;nxtreg cs yd , re;nxthausman;/*拒绝随机效应,应该采用固定效 应*/;第六节 动态面板数据模型nStata命令:nXtabond(自带)nXtabond2(需要从网络上下载)。