面板数据的处理PPT课件

上传人:ni****g 文档编号:590325159 上传时间:2024-09-13 格式:PPT 页数:55 大小:987KB
返回 下载 相关 举报
面板数据的处理PPT课件_第1页
第1页 / 共55页
面板数据的处理PPT课件_第2页
第2页 / 共55页
面板数据的处理PPT课件_第3页
第3页 / 共55页
面板数据的处理PPT课件_第4页
第4页 / 共55页
面板数据的处理PPT课件_第5页
第5页 / 共55页
点击查看更多>>
资源描述

《面板数据的处理PPT课件》由会员分享,可在线阅读,更多相关《面板数据的处理PPT课件(55页珍藏版)》请在金锄头文库上搜索。

1、面板数据的处理2021/3/91引言引言如果想估计我国的如果想估计我国的“消费函数消费函数”如果我有如果我有2005年年31个省市自治区的个省市自治区的“家庭可支家庭可支配收入配收入”与与“家庭消费家庭消费”的数据的数据则画散点图;则画散点图;做回归;做回归;2021/3/922021/3/93引言引言利用利用2005年年31个省市自治区的个省市自治区的“家庭可支配家庭可支配收入收入”与与“家庭消费家庭消费”的数据:的数据: CONS = -10.51 + 1.31*INCOME2021/3/94引言引言如果想估计我国的如果想估计我国的“消费函数消费函数”如果我有如果我有北京市北京市20002

2、008年的年的“家庭可支配家庭可支配收入收入”与与“家庭消费家庭消费”的数据的数据则画散点图;则画散点图;做回归;做回归;2021/3/952021/3/96引言引言利用利用北京市北京市20002008年的年的“家庭可支配收家庭可支配收入入”与与“家庭消费家庭消费”的数据:的数据: CONS = -4732.85 + 1.72*INCOME2021/3/97引言引言如果想估计我国的如果想估计我国的“消费函数消费函数”如果我有如果我有31个省市自治区,从个省市自治区,从20002008年年的的“家庭可支配收入家庭可支配收入”与与“家庭消费家庭消费”的数据的数据应该如何做回归?应该如何做回归?20

3、21/3/98引言引言可能的处理方法:可能的处理方法:谨慎型谨慎型无知者无谓型无知者无谓型2021/3/99引言引言谨慎型谨慎型估计估计31个不同地区的消费方程;个不同地区的消费方程;本质假设本质假设:消费行为在不同地区之间:消费行为在不同地区之间有有差异,差异,但同一地区在不同时间内但同一地区在不同时间内没有没有差异;差异;2021/3/910引言引言谨慎型谨慎型估计估计9个不同时期的全国消费方程;个不同时期的全国消费方程;本质假设本质假设:消费行为在不同地区之间:消费行为在不同地区之间没有没有差异,差异,但同一地区在不同时间内但同一地区在不同时间内有有差异;差异;2021/3/911引言引

4、言无知者无谓型无知者无谓型把所有数据混在一起做回归;把所有数据混在一起做回归;本质假设本质假设:消费行为在不同地区之间:消费行为在不同地区之间没有没有差异,差异,同一地区在不同时间内同一地区在不同时间内也没有也没有差异;差异;2021/3/912引言引言上述处理方法的缺陷上述处理方法的缺陷没有充分利用数据;没有充分利用数据;无法避免遗漏变量的影响;无法避免遗漏变量的影响;有时候无法进行上述处理;有时候无法进行上述处理;2021/3/913面板数据的处理面板数据的处理一、基本概念一、基本概念二、案例:啤酒税与交通死亡率之间的回归二、案例:啤酒税与交通死亡率之间的回归2021/3/914面板数据的

5、处理面板数据的处理一、基本概念一、基本概念面板数据(面板数据(panel data)平衡面板数据、非平衡面板数据平衡面板数据、非平衡面板数据(balanced panel data)2021/3/915二、案例研究二、案例研究:啤酒税与交通死亡率啤酒税与交通死亡率 2021/3/916U.S. traffic death data for 1982: 较高的酒精税,更多的交通死亡吗? $19822021/3/917U.S. traffic death data for 1988 较高的酒精税,更多的交通死亡吗? 2021/3/918啤酒税越高,交通死亡率越高?啤酒税越高,交通死亡率越高? 20

6、21/3/919遗漏因素可能引起遗漏变量偏误。遗漏因素可能引起遗漏变量偏误。 Example #1: traffic density. Suppose: (i) High traffic density means more traffic deaths (ii) (Western) states with lower traffic density have lower alcohol taxes 特别地,“高税收”可能反映“高的交通密度” (所以OLS系数可能是正偏误 高税收,更多的死亡) 当遗漏变量在给定的州内并不随着时间变化而改变时当遗漏变量在给定的州内并不随着时间变化而改变时, 面面

7、板数据可以让我们消除遗漏变量偏误。板数据可以让我们消除遗漏变量偏误。 2021/3/920两时期面板数据两时期面板数据2021/3/921Suppose E u |BeerTax , i) = 0.主要的想法: 从1982到1988年死亡率的任何改变改变,不可能由Zi引起,因为(by assumption)在1982到1988年期间 Zi 没有改变 数学: consider fatality rates in 1988 and 1982: FatalityRatei1988 = b0 + b1BeerTaxi1988 + b2Zi + ui1988 FatalityRatei1982 = b0

8、 + b1BeerTaxi1982 + b2Zi + ui1982 (ititZ 把两个时期的回归方程相减把两个时期的回归方程相减2021/3/922FatalityRatei1988 = b0 + b1BeerTaxi1988 + b2Zi + ui1988 FatalityRatei1982 = b0 + b1BeerTaxi1982 + b2Zi + ui1982 so FatalityRatei1988 FatalityRatei1982 = b1(BeerTaxi1988 BeerTaxi1982) + (ui1988 ui1982) 新的误差项, (ui1988 ui1982),

9、与 BeerTaxi1988或 BeerTaxi1982.都不相关。 这个“相减的”等式可以用OLS进行估计, 尽管 Zi 无法观测。 2021/3/923啤酒税与交通死亡率 2021/3/924FatalityRate v. BeerTax: 2021/3/925固定效应的回归固定效应的回归Fixed Effects Regression What if you have more than 2 time periods ( T 2)? Yit = b0 + b1Xit + b2Zi + uit, i =1,n, T = 1,T We can rewrite this in two usef

10、ul ways: 1. “n-1二元自变量” regression model 2. “固定效应” regression model 2021/3/926Yit = b0 + b1Xit + b2Zi + ui, i =1,n, T = 1,T 我们首先重写为“固定效应固定效应”的形式. Suppose we have n = 3 states: California, Texas, Massachusetts. 2021/3/927Yit = b0 + b1Xit + b2Zi + ui, i =1,n, T = 1,T California (that is, i = CA)的总体回归:

11、YCA,t = b0 + b1XCA,t + b2ZCA + uCA,t = (b0 + b2ZCA) + b1XCA,t + uCA,t or YCA,t = aCA + b1XCA,t + uCA,t aCA = b0 + b2ZCA 不随时间改变 aCA是CA的截距, b1 是斜率 截距对CA是独特的, 但是斜率对所有州是相同的: 平行线. 2021/3/928For TX: YTX,t = b0 + b1XTX,t + b2ZTX + uTX,t = (b0 + b2ZTX) + b1XTX,t + uTX,t or YTX,t = aTX + b1XTX,t + uTX,t, whe

12、re aTX = b0 + b2ZTX 收集所有三个州的直线: YCA,t = aCA + b1XCA,t + uCA,t YTX,t = aTX + b1XTX,t + uTX,t YMA,t = aMA + b1XMA,t + uMA,t or Yit = ai + b1Xit + uit, i = CA, TX, MA, T = 1,T 2021/3/929The regression lines for each state in a picture 2021/3/9302021/3/931总结: 两种方法写出固定效应模型 “n-1二元自变量”的形式 2021/3/932固定效应回归的

13、参数估计固定效应回归的参数估计三种估计方法三种估计方法: 1. “n-1二元自变量” OLS回归 2. “Entity-demeaned(个体中心化)” OLS回归 3. “改变”设定, 无截距(仅仅适用于T = 2) 三种方法可以找出相同的回归系数的估计和相同的标准误差。 我们已经进行了“改变”的设定 (1988 minus 1982) 但是仅仅适用于T = 2年 方法#1和#2适用于一般的T 方法#1仅仅适用于当n 不是太大的实践。 2021/3/9331. “n-1 binary regressors” OLS regression2021/3/9342. “Entity-demeane

14、d” OLS regression2021/3/9352. “Entity-demeaned” OLS regression2021/3/9362. “Entity-demeaned” OLS regression2021/3/937Example. For n = 48, T = 7: 2021/3/938Regression with Time Fixed Effects2021/3/939Time fixed effects only2021/3/940面板数据处理方法的本质面板数据处理方法的本质为了解决为了解决“由于无法观测而遗漏重要变量由于无法观测而遗漏重要变量”的问题!的问题!例如

15、,利用例如,利用“截面数据截面数据”构造回归方程:构造回归方程:其中其中但是,但是,X2是无法观测的!怎么办?是无法观测的!怎么办?2021/3/941处理方法一处理方法一对每一个个体多观测几期(对每一个个体多观测几期(T期)期)于是有于是有X2,i1, X2,i2,X2,iT 假设:假设:该变量(该变量(X2 )在不同时期都相等!)在不同时期都相等!但对不同个体之间有差异。但对不同个体之间有差异。例如:酒精税在各州是不同的,但在考察例如:酒精税在各州是不同的,但在考察期内没有变化。期内没有变化。2021/3/942处理方法一处理方法一假设:假设:该变量(该变量(X2 )在不同时期都相等!)在

16、不同时期都相等!但对不同个体之间有差异。但对不同个体之间有差异。固定效应模型固定效应模型2021/3/943Yit = b0 + b1Xit + b2Zi + ui, i =1,n, T = 1,T Suppose we have n = 3 states: California, Texas, Massachusetts案例:酒精税与交通死亡率的回归案例:酒精税与交通死亡率的回归2021/3/944The regression lines for each state in a picture Y = aCA + b1X Y = aTX + b1X Y = aMA+ b1X aMA aTX

17、aCA Y X MA TX CA 2021/3/945处理方法一处理方法一固定效应模型固定效应模型的参数估计:的参数估计: 1、前后两期相减(适用于、前后两期相减(适用于T=2);); 2、引入(、引入(n-1)个虚拟变量的回归;)个虚拟变量的回归; 3、去中心化回归;、去中心化回归; (1)固定效应估计量()固定效应估计量(FEE);); (2)与虚拟回归的估计量()与虚拟回归的估计量(LSDV)相同;)相同; (3)无法估计)无法估计“常数项常数项”;2021/3/946处理方法一处理方法一固定效应模型固定效应模型的参数估计:的参数估计: 如果满足如下条件:如果满足如下条件: 且自变量之间

18、不存在共线性,则且自变量之间不存在共线性,则 那么(那么(FEE)与()与(LSDV)就是一个)就是一个BLUE估计量;估计量; 所有的所有的 t检验、检验、F检验都可以使用;检验都可以使用; 所以,可以检验所以,可以检验“固定效应固定效应”是否存在;是否存在;2021/3/947处理方法二处理方法二对每一时期,多观测几个个体(对每一时期,多观测几个个体(n个个体)个个体)于是有于是有X2,i1, X2,i2,X2,iT 假设:假设:该变量(该变量(X2 )在不同时期之间有差)在不同时期之间有差异!但对不同个体都相等。异!但对不同个体都相等。例如,汽车的安全性能在考察期内提高了,例如,汽车的安

19、全性能在考察期内提高了,该因素显然在不同州之间没有差异;该因素显然在不同州之间没有差异;2021/3/948处理方法二处理方法二假设:假设:该变量(该变量(X2 )在不同时期之间有差)在不同时期之间有差异!但对不同个体都相等。异!但对不同个体都相等。这也是这也是固定效应固定效应模型,只是在模型,只是在时间上固定时间上固定;2021/3/949处理方法二处理方法二固定效应模型固定效应模型的参数估计:的参数估计:与前述相同:与前述相同: 1、两个体之间相减,再回归(适用于、两个体之间相减,再回归(适用于n=2);); 2、引入(、引入(T-1)个虚拟变量的回归;)个虚拟变量的回归; 3、去中心化回

20、归;、去中心化回归;2021/3/950处理方法三处理方法三对每一个个体多观测几期(对每一个个体多观测几期(T期)期)于是有于是有X2,i1, X2,i2,X2,iT 假设:假设:该变量(该变量(X2 )在不同时期都相等!)在不同时期都相等!但对不同个体之间有差异。但对不同个体之间有差异。但这个但这个差异差异是是随机的随机的!而不是确定性的。!而不是确定性的。2021/3/951处理方法三处理方法三假设:假设:该变量(该变量(X2 )在不同时期都相等!)在不同时期都相等!但对不同个体之间有差异。但对不同个体之间有差异。但这个但这个差异差异是是随机的随机的!此时,(此时,(0+vi )体现了不同

21、个体间的差异,)体现了不同个体间的差异,而而vi是随机变量。是随机变量。误差成分模型误差成分模型(之一)(之一)2021/3/952处理方法三处理方法三1、误差成分模型(之一)、误差成分模型(之一) 要求:随机项要求:随机项vi与自变量与自变量X之间不相关之间不相关2、误差成分模型(之一)、误差成分模型(之一) 随机项随机项vi与自变量与自变量X之间相关之间相关2021/3/953处理方法三处理方法三误差成分模型误差成分模型的参数估计的参数估计Eviews自动给出;自动给出;随机效应估计量(适用于随机效应估计量(适用于“之一之一”)固定效应估计量(适用于固定效应估计量(适用于“之二之二”)2021/3/954放映结束 感谢各位的批评指导! 谢谢 谢!谢!让我们共同进步2021/3/955

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号