Stata面板数据的统计分析

资源描述

《Stata面板数据的统计分析》由会员分享，可在线阅读，更多相关《Stata面板数据的统计分析（3页珍藏版）》请在金锄头文库上搜索。

1、面板数据的统计分析（Stata）在写论文时经常碰见一些即是时间序列又是截面的数据，比如分析1999-2010的公司盈余管理影响因素，而影响盈余管理的因素有6个，那么会形成如下图的数据公司1公司2公司100因素1因素6盈余管理程度因素1因素6盈余管理程度因素1因素6盈余管理程度199920002010如上图所示的数据即为面板数据。显然面板数据是三维的，而时间序列数据和截面数据都是二维的，把面板数据当成时间序列数据或者截面数据来处理都是不合适的。处理面板数据的软件较多，一般使用Eviews6.0、Stata等。个人推荐使用Stata,因为Stata比较适合处理面板数据，且个性化强。以下以Stata

2、ll.O为例来讲解怎么样处理面板数据。由于面板数据的存储结构与我们通常使用的存储结构不太一样，所在统计分析前，最好在excel中整理一下数据，形成如下图所示的数据年份公司名称因素1因素2因素6盈余管理程度1999公司12000公司1公司12010公司111999公司22000公司2公司22010公司2n变量定义及输入数据启动Statall.OStata界面有4个组成部分，Review（在左上角）、Variables（左下角）、输出窗口（在右上角）、Command（右下角）。首先定义变量，可以输入命令，也可以通过点击Data-CreatenewVariableorchangevariable特别

3、注意，这里要定义的变量除了因素1、因素2、因素&盈余管理影响程度等，还要定义年份和公司名称两个变量，这两个变量的数据类型（Type）最好设置为int（整型），公司名称不要使用中文名称或者字母等，用数字代替。定义好变量之后可以输入数据了。数据可以直接导入（File-Import），也可以手工录入或者复制粘贴（Data-DataEdit（Browse），手工录入数据和在excel中的操作一样。以上面说的为例，定义变量year、company、factor1、factor2、factor3、factor4、factor5、factor6、DA。变量company和year分别为截面变量和时间变量。显

4、然，通过这两个变量我们可以非常清楚地确定paneldata的数据存储格式。因此，在使用STATA估计模型之前，我们必须告诉它截面变量和时间变量分别是什么，所用的命令为tsset，命令为：tssetcompanyyear输出窗口将输出相应结果。由于面板数据本身兼具截面数据和时间序列二者的特性，所以对时间序列进行操作的运算同样可以应用到面板数据身上。这一点在处理某些数据时显得非常方便。如，对于上述数据，我们想产生一个新的变量Lag_factor1，也就是factor1的一阶滞后，那么我们可以采用如下命令：genLag_factor1=L.factor1差分变量：Genfiscal（D）=D.fis

5、cal统计描述：在正式进行模型的估计之前，我们必须对样本的基本分布特性有一个总体的了解。对于面板数据而言，我们至少要知道我们的数据中有多少个截面（个体），每个截面上有多少个观察期间，整个数据结构是平行的还是非平行的。进一步地，我们还要知道主要变量的样本均值、标准差、最大值、最小值等情况。这些都可以通过以下三个命令来完成：xtdes命令用于初步了解数据的大体分布状况，我们可以知道数据中含有多少个截面，最大和最小的时间跨度是多少。在某些要求使用平行面板数据的情况下，我们可以采用该命令来诊断处理后的数据是否为平行数据。Xtsum用来查询对组内、组间、整体计算各个变量的基本统计量（如均值、方差等）。为

6、了方便，以下的举例都只用factor1，factor2两个自变量。xtdesDAfactor1facto2xtsumDAfactor1facto2模型回归。常用的处理面板数据的模型有混合OLS模型、固定效应模型、随机效应模型。各个模型的区别请上网查查。下面说说各个模型的命令：混合OLS模型输入命令：regressDAfactor1facto2固定效应模型输入命令：xtregDAfactor1factor,fe随机效应模型输入命令：xtregDAfactor1factor,re模型的选择及检验固定效应模型要检验个体效应的显著性，这可以通过固定效应模型回归结果的最后一行的F统计量看出，F越大越好，

7、可以得出固定效应模型优于混合OLS模型的结论。随机效应模型要检验随机效应是否显著，要输入命令：xttest0如果检验得到的p值为0,则随机效应显著，随机效应模型也优于固定效应模型。至于固定效应模型与随机效应模型选哪一个，则要通过hausman检验来得出。Hausman检验Hausman检验的原假设是固定效应模型优于随机效应模型，如果hausman检验的p值为0，则接受原假设，使用固定效应模型。相关命令：quixtregDAfactor1factor2,feeststorefequixtregDAfactor1factor2,reeststorerehausmanfe面板模型选择问题1.固定效应

8、模型估计：xtreggdpinvestculturescihealthadmintechno,fe固定效应模型中个体效应和随机干扰项的方差估计值(分别为sigmau和sigmae),二者之间的相关关系(rho)最后一行给出了检验固定效应是否显著的F统计量和相应的P值2.随机效应模型估计：xtreggdpinvestculturescihealthadmintechno,re检验随机效应模型是否优于混合OLS模型：在进行随机效应回归之后,使用xttest0检验得到的P值为0.0000,表明随机效应模型优于混合OLS模型3.最大似然估计Ml：xtreggdpinvestculturesciheal

9、thadmintechno,mleHausman检验Hausman检验究竟选择固定效应模型还是随机效应模型：第一步：估计固定效应模型,存储结果xtreggdpinvestculturescihealthadmintechno,feeststorefe第二步：估计随机效应模型,存储结果xtreggdpinvestculturescihealthadmintechno,reeststorere第三步：进行hausman检验hausmanfeHausman检验量为：H=(b-B)Var(b)-Var(B)-1(b-B)x2(k)Hausman统计量服从自由度为k的x盼布。当H大于一定显著水平的临界值

10、时，我们就认为模型中存在固定效应,从而选用固定效应模型,否则选用随机效应模型如果hausman检验值为负，说明的模型设定有问题，导致Hausman检验的基本假设得不到满足，遗漏变量的问题，或者某些变量是非平稳等等可以改用hausman检验的其他形式：hausmanfe,sigmaless面板模型异方差和自相关的检验(比较复杂：三个模型、两个维度)对于固定效应模型的异方差检验和自相关的检验：序列自相关检验Xtserialgdpinvestculturescihealthadmintechno如果没有xtserial命令即输入上面的命令后弹出nocommand,则输入finditxtserial.

11、ado可以自动搜索到进行安装截面自相关检验xtregDAfactor1factor2,fexttest2截面（组间）异方差检验（不考虑序列异方差即组内）xtreggdpinvestculturescihealthadmintechno,fexttest3随机效应模型的自相关检验：序列自相关检验xtreggdpinvestculturescihealthadmintechno,reXttest1处理：异方差用robust序列自相关用GLS方法截面自相关用cluster方法（聚类调整）聚类调整（Peterson，2009）：主要调整截面自相关（面板数据可用）,vce（clustercompany/year）或者clustercompany/year如果存在面板数据的时候，用固定效应做计量检验时，当然能够很容易地部分解决内生性问题，注意，仅仅是部分解决！

展开阅读全文