计量经济学_詹姆斯斯托克_第9章_面板数据的处理

上传人:xmg****18 文档编号:116862096 上传时间:2019-11-17 格式:PPT 页数:104 大小:5.54MB
返回 下载 相关 举报
计量经济学_詹姆斯斯托克_第9章_面板数据的处理_第1页
第1页 / 共104页
计量经济学_詹姆斯斯托克_第9章_面板数据的处理_第2页
第2页 / 共104页
计量经济学_詹姆斯斯托克_第9章_面板数据的处理_第3页
第3页 / 共104页
计量经济学_詹姆斯斯托克_第9章_面板数据的处理_第4页
第4页 / 共104页
计量经济学_詹姆斯斯托克_第9章_面板数据的处理_第5页
第5页 / 共104页
点击查看更多>>
资源描述

《计量经济学_詹姆斯斯托克_第9章_面板数据的处理》由会员分享,可在线阅读,更多相关《计量经济学_詹姆斯斯托克_第9章_面板数据的处理(104页珍藏版)》请在金锄头文库上搜索。

1、第六章:面板数据的处理 时间序列数据和截面数据都是一维数据。 时间序列数据是变量按照时间得到的数据;截面数 据是变量在截面空间上的数据。面板数据是同时在 时间和截面上取得的二维数据。 所以,面板数据(panel data)也称时间序列截面 数据(time series and cross section data)或 混合数据(pool data) 当描述截面数据时,我们用下标表示个体,如Yi表示 变量Y的第i个个体。当描述面板数据时,我们需要其 他符号同时表示个体和时期。为此我们采用双下标而 不是单下标,其中第一个下标i表示个体,第二个下 标t表示观测时间。 如Yit表示n个个体中第i个个体

2、在T个时期中的第t期时 观测到的变量Y的值。 样本容量较大:可以解决样本容量不足的问题,改进 模型估计的有效性。 可以解决遗漏变量问题。遗漏变量偏差是一个普遍存 在的问题,虽然可以用工具变量法解决,但有效的工 具变量常常很难找到。遗漏变量常常是由于不可观测 的个体差异或“异质性”所造成,如果这种个体差异“ 不随时间而变化”,则面板数据提供了解决遗漏变量 问题的又一利器。 提供更多个体动态行为的信息。由于面板数据同时有 截面与时间两个维度,有时它可以解决单独的截面数 据或时间序列数据所不能解决的问题。 面板数据的优势 案例一 如果想估计我国的“消费函数” 如果我有2005年31个省市自治区的“家

3、庭可支 配收入”与“家庭消费”的数据 则画散点图; 做回归; 案例一 利用2005年31个省市自治区的“家庭可支 配收入”与“家庭消费”的数据: CONS = -10.51 + 1.31*INCOME 案例一 如果想估计我国的“消费函数” 如果我有北京市20002008年的“家庭可支配 收入”与“家庭消费”的数据 则画散点图; 做回归; 案例一 利用北京市20002008年的“家庭可支配 收入”与“家庭消费”的数据: CONS = -4732.85 + 1.72*INCOME 案例一 如果想估计我国的“消费函数” 如果我有31个省市自治区,从20002008年 的“家庭可支配收入”与“家庭消费

4、”的数据 应该如何做回归? 案例一 基本概念 面板数据(panel data) 平衡面板数据(balanced panel data)、非 平衡面板数据(unbalanced panel data) 案例一 可能的处理方法: 谨慎型 无知者无畏型 案例一 谨慎型 方法一:估计31个不同地区的消费方程; 本质假设:消费行为在不同地区之间有差异, 但同一地区在不同时间内没有差异; 案例一 谨慎型 方法二:估计9个不同时期的全国消费方程; 本质假设:消费行为在不同地区之间没有差异 ,但同一地区在不同时间内有差异; 案例一 无知无畏型 把所有数据混在一起做回归; 本质假设:消费行为在不同地区之间没有差

5、异 ,同一地区在不同时间内也没有差异; 案例一 上述处理方法的缺陷 要么没有充分利用数据(谨慎型),要么 过于大胆使得估计结果犯错的可能性非常大; 本章的两大问题 对面板数据如何处理? 为什么要发明一个“面板数据”? 案例二: 啤酒税与交通死亡率 观测的数据: 48 U.S. states, so n = 48; 7 years (1982, 1988), so T = 7; Balanced panel, so total observations = 748 = 336 案例二: 啤酒税与交通死亡率 变量: Traffic fatality rate (交通死亡率, 当 年、当地,每 10

6、,000人中死于交通事故的人 数) Tax on a case of beer(啤酒税) Other (其他因素,legal driving age, drunk driving laws, etc.) 案例二: 啤酒税与交通死亡率 啤酒税与交通死亡率会是什么关系? U.S. traffic death data for 1982: 较高的啤酒税,会导致更多的交通死亡吗? $1982 U.S. traffic death data for 1988 较高的啤酒税,会导致更多的交通死亡吗? 啤酒税越高,交通死亡率越高? ? 答案似乎是肯定的,但与我们的常识不相 符!为什么会这样? 原因:可能是因

7、为遗漏了重要变量! 决定交通死亡率的其他因素: Quality (age) of automobiles Quality of roads “Culture” around drinking and driving Density of cars on the road 遗漏变量可能引起估计的偏误 High traffic density means more traffic deaths 交通密度与啤酒税之间可能存在着较高的 正相关关系; 遗漏交通密度变量,会导致OLS估计产生高 估的可能!导致“啤酒税”与“交通死亡 ”之间呈现出显著的正向关系。 Example : traffic dens

8、ity(交通密度) 如果X2=b21*X1+i,则事实上有 整理后: 可以证明 遗漏相关变量“过低拟合”模型 (1) 遗漏重要变量的烦恼 现实研究常常无法避免“遗漏重要变量”的情 况发生; 这将导致我们的回归结果存在系统性的偏误; 怎么办呢? 在某些情况下,可以通过“面板数据”进行回 归,解决这一问题! 案例二: 啤酒税与交通死亡率 在美国,交通密度的情况在州与州之间差 异较大,但在同一个州内,近些年来变化 不大。 当遗漏变量在给定的地区内并不随着时间 变化而改变时,面板数据可以让我们消除 遗漏变量偏误! 两时期面板数据 Zi 是不随着时间改变,但会随着个体变化的因 素。 假设Zi无法观测,所

9、以它的遗漏会带来遗漏变量 的偏误。 Zi 的影响可以通过使用T = 2年的面板数据的处理 来消除。 主要的想法: 所以,两个地区1988年和1982年的回归方程: FatalityRatei1988 = 0 + 1BeerTaxi1988 + 2Zi + ui1988 FatalityRatei1982 = 0 + 1BeerTaxi1982 + 2Zi + ui1982 处理方法:把两个时期的回归方程相减! 因为我们假设Z i 不随时间而改变。 从1982-1988年期间,任何一个地区i 的死亡 率的任何改变,都不可能是由Z i 引起的。 相减后得到: FatalityRatei1988 F

10、atalityRatei1982 = 1(BeerTaxi1988 BeerTaxi1982) + (ui1988 ui1982) 案例二: 啤酒税与交通死亡率 FatalityRate v. BeerTax: 问题 在上述模型中,如果超过两期,即T2 ,怎么处理呢? 面板数据模型的一般理论 在模型的设定上,分为两大类: (一)“固定效应”模型; (二)“随机效应”模型; 1、“固定效应”的模型形式; 2、“固定效应”回归的参数估计; 3、一般化的“固定效应”模型; 4、面板数据模型的缺陷; (一) 固定效应的回归 Fixed Effects Regression “固定效应”的模型一般形式

11、1、“固定效应”的模型形式 要求: “固定效应”的模型一般形式 1、“固定效应”的模型形式 可写成: 2、固定效应回归的参数估计 两种估计方法: (1)引入(N-1)个哑变量的回归; (n-1 binary regressor)(LSDV估计) (2)去中心化的回归; (“Entity-demeaned” OLS) (1)引入(N-1)个哑变量的回归 Suppose we have n=3 states, California, Texas, Massachusetts 所有三个州的回归线 : YCA,t = CA + 1XCA,t + uCA,t YTX,t = TX + 1XTX,t +

12、uTX,t YMA,t = MA + 1XMA,t + uMA,t or Yit = i + 1Xit + uit, i = CA, TX, MA, T = 1,T The regression lines for each state 上述情形可以用“带虚拟变量的回归”来表示: (1)引入(N-1)个哑变量的回归 (1)引入(N-1)个哑变量的回归 一般性方法: 首先建立包含二元变量D2i,Dni的回归; Yit = 0 + 1Xit + 2D2i + + nDni + uit 其中,D2i 、D3i、. Dni为哑变量; 然后用OLS估计上式中的参数; 各种检验如常; 但当n 非常大时不适

13、用 。 (2) 去中心化的回归 “Entity-demeaned” OLS regression (2) 去中心化的回归 “Entity-demeaned” OLS regression (2) 去中心化的回归 “Entity-demeaned” OLS regression 请问:随个体变化的截距项如何估计? 请问:随个体变化的截距项如何估计? 1. 有时根本不需要估计常数项; 2. 使用“引入虚拟变量回归”的方法,可以 将变化的常数项估计出来; 3. 还可以把估计出的斜率代入到每个州的 回归方程中,计算出每个州的常数项; 3、一般化的“固定效应”模型 (1)个体的固定效应模型(已讲); (

14、2)时间的固定效应模型; (3)个体与时间的固定效应模型 (2)时间固定效应模型 Regression with Time Fixed Effects 遗漏的变量只随时间而改变,但不随州的 不同而改变: l出现了较安全的车(air bags, etc.); l全国法律的改变; 这产生了随时间改变的截距 ! (2)时间固定效应模型 Regression with Time Fixed Effects 估计方法: 引入虚拟变量的回归(略); 去中心化的回归 (2)时间固定效应模型 Regression with Time Fixed Effects 去中心化的回归 首先,在个体维度上做平均,得到各

15、年份的均值: 然后,进行去中心化处理: (2)时间固定效应模型 Regression with Time Fixed Effects 去中心化的回归: 方程改写为: 其中 (3)个体与时间分别固定效应模型 在遗漏的变量中,有的是只随时间而改变 ,但不随个体的不同而改变;有的是只随 个体的不同而改变,但不随时间的不同而 改变; l出现了较安全的车(air bags, etc.); l道路上车辆的密度; (3)个体与时间分别固定效应模型 这使得截距项分解成了两部分: 随时间改变的截距 + 随个体改变的截距 (3)个体与时间分别固定效应模型 参数估计方法: 连续两次应用“去中心化”的方 法对原始回归

16、方程进行处理。 第一次:在时间维度上进行去中 心化处理,以消除 i ; 第二次:在个体维度上进行去中 心化处理,以消除 t ; 4、面板数据模型的缺陷 问题: 可以写成如下形式吗? 4、面板数据模型的缺陷 答案:不行! 因为,连续两次应用“去中心化”的方法 对原始回归方程进行处理后,依然无法消 除Sit。 所以,如果遗漏的变量是既随时间改变, 同时也随个体改变,则即使使用面板数据 也无法消除它的影响。 (二) 随机效应的面板回归 Random Effects Regression (1)模型设定 ; (2)参数估计; (1)模型的设定 模型设定 : ( ) (1)模型的设定 此时,随机项的方差为: (1)模型的设定 此时,同一个个体,不同时点的随机项, 彼此之间会相关:

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号