《经济EViews数据统计与分析教程.ppt》由会员分享,可在线阅读,更多相关《经济EViews数据统计与分析教程.ppt(421页珍藏版)》请在金锄头文库上搜索。
1、EViews数据统计与分析教程第1章 EViews软件基础 重点内容: EViews软件的安装与启动 EViews软件的主要功能 常用的概率分布 一、EViews软件简介EViews的前身是1981年发行的Micro TSP(时间序列分析软件包)。目前已更新到5.0、5.1、6.0版本。该软件主要应用于经济、金融、管理和保险等领域。一、EViews软件简介 EViews的特点:1.分析处理时间序列数据。2.具有现代Windows软件可视化操作的优点。3.EViews具有命令功能和批处理语言功能。二、EViews软件安装与启动 QMS公司的网站(http:/www.EV )提供了EViews软件
2、的下载专区,可进入该区并进行下载操作。或到网上搜索EViews软件,并进行软件压缩包的下载。二、EViews软件安装与启动 EViews软件的启动方法: 方法一:单击任务栏上的“开始”按钮,选择“程序”|“EViews 5”选项中的“EViews 5”图标。方法二:使用Windows浏览器或从桌面上“我的电脑”定位EViews所安装的目录,双击“EViews”程序图标。三、EViews主要窗口介绍工作区命令窗口主菜单栏标题栏状态栏EViews的窗口主要包括标题栏、主菜单栏、命令窗口、状态栏和工作区等部分,如下图所示。 四、EViews主要功能l对基本数据进行处理l通过公式生成新序列l统计描述l
3、模型检验l估计方法的执行l基于回归方程的预测l模型的求解与模拟l数据库的管理l与其他软件(如EXCEL)进行数据交换EViews软件功能很强,可以对以时间序列为主的多种类型的数据进行操作。可以将EViews主要功能概括为如下几点: 五、概率统计知识 1. 概率分布常见的概率分布有4种,包括l正态分布,lx2分布,lt分布lF分布 正态分布 如果X服从正态分布,则正态分布图 五、概率统计知识 统计检验中常用的两个重要结论:(1)Prob(x1.96x Xi +x+ 1.96x)0.95 1-1(2)Prob(x2.57x Xi +x+2.57x)0.99 1-2 其中,x和x分别是正态随机变量X
4、的均值和标准差。 公式1-1表示,正态随机变量X的观测值落在均值的距离为1.96倍标准差范围内的概率约为0.95;公式1-2表示,正态随机变量X的观测值落在均值的距离为2.57倍标准差范围内的概率约为0.99 。 五、概率统计知识 不同的均值和方差下的正态分布,其形状不同 a)表示均值不同,方差相同;b)表示均值相同,方差不同;c)均值和方差都不同 五、概率统计知识2分布服从标准正态分布的随机变量X的平方服从自由度为1的2分布,记作l若xN 0,1则 z =x22(1)l若x1,x2,x3,xn 是n个相互独立的服从2分布且自由度为1的随机变量,即2(1) 则z=i xi2(n) 五、概率统计
5、知识2分布图t分布 若X是一个服从N(0,1)的变量,Y是一个独立于x且服从2(n)的变量,则变量Z服从自由度为n的t分布, 即 五、概率统计知识t分布图 五、概率统计知识F分布若变量xi(i=1,2,m)服从正态分布N(x, 2x),变量yi(i=1,2,n)服从正态分布N(y, 2y),两个变量xi与yi相互独立。设 则 当F值接近于1时,两个正态总体分布x与y的方差相等,即2x =2y;反之,则方差不等。 五、概率统计知识F分布图 五、概率统计知识 t分布与正态分布形状相同,也是对称的,但两端尾部比正态分布要高些。 正态分布、2分布、t分布和F分布之间的关系 (1)当t分布的自由度足够大
6、时,其近似标准正态分布。(2)在F分布中,当自由度(m-1)与 (n-1)逐渐增大时,F分布近似于正态分布。(3)在2分布中,当其自由度足够大时,近似于正态分布。五、概率统计知识 2.常见估计l点估计 l区间估计点估计设X1, X2,Xn为来自总体X的样本,x1, x2,xn为相应的样本值。为总体分布的未知参数,为了估计未知参数,构造一个统计量h(X1, X2,Xn),然后用该统计量h(x1, x2,xn)的值来估计的真值。称h(X1, X2,Xn)为的估计量,h(x1, x2,xn)为的估计值。 的估计值是数轴上的一点,用估计值作为真值的近似值就相当于用一个点来估计,因此为点估计。点估计 点
7、估计 五、概率统计知识点估计要具有的性质无偏性无偏性 有效性一致性五、概率统计知识区间估计区间估计是关于参数和服从已知分布的点估计的一个函数。令p(g,)是所构造的随机变量,给出预定的置信水平1-,则可以表述为Prob(b p(g,)0时,序列分布为右偏;当S 0,所以我国的外商直接投资(fdi)的分布是不对称的,为右偏分布形态。 二、描述性统计量1.序列窗口下的描述性统计量 “Kurtosis”表示峰度,用来衡量序列分布的凸起状况,其计算公式为正态分布的K值为3,当K 3时,序列对象的分布凸起程度大于正态分布的凸起程度;当K 3,外商直接投资(fdi)的分布呈尖峰状态。 二、描述性统计量1.
8、序列窗口下的描述性统计量 图最下方是JB(Jarque-Bera)统计量及其相应的概率(Probability)。JB统计量用来检验序列观测值是否服从正态分布,该检验的零假设为样本服从正态分布。在零假设下,JB统计量服从2(2)分布。 二、描述性统计量1.序列窗口下的描述性统计量 第二个选项是“Stats Table”(统计表),它将描述性统计量值通过电子表格的形式显示在对象窗口中。第三个选项是“Stats by Classification”(分类统计量),它将样本分为若干组后再对各组观测值分别进行描述统计。第四个选项是“Boxplots by Classification”(分类箱线图/箱
9、尾图),将序列分布按照箱线图/箱尾图进行分类。箱线图(Boxplot)也称为箱尾图,是利用数据统计量来描述数据的一种方法。二、描述性统计量2.序列组窗口下的描述性统计量 在序列组(Group)对象窗口下选择工具栏中的“View”| “Descriptive Statistics”(描述性统计量)选项,将弹出3个选项。 二、描述性统计量2.序列组窗口下的描述性统计量 第一个选项是“Common Sample”(普通样本),选择该项将得到含有均值、中位数、最大/小值等统计量的一张电子表格。“Common Sample”要求各序列对象的样本范围相同,不能含有NA符(空值)。二、描述性统计量2.序列组
10、窗口下的描述性统计量 第二个选项是“Individual Samples”(个体样本),选择该项后弹出的界面也是一张含有均值、中位数、最大/小值等统计量的一张电子表格。与“Common Sample”不同的是该选项中序列对象所包含的观测值个数可以不同。第三个选项是“Boxplots”(箱线图/箱尾图)。三、描述性统计量检验1.简单假设检验 l均值(Mean)检验l方差(Variance)检验l中位数(Median)检验 三、描述性统计量检验1.简单假设检验 选择“View”| “Tests for Descriptive Stats” | “Simple Hypothesis Tests”选项
11、后弹出如下图所示的对话框,在左侧文本框中输入待检验的数值,然后单击“OK”按钮即可得到输出结果。对于均值检验,如果标准差已知,可在右侧“Enter s.d. if”文本框中输入标准差的值。三、描述性统计量检验2.分组齐性检验 l均值(Mean)检验l方差(Variance)检验l中位数(Median)检验 三、描述性统计量检验2.分组齐性检验 选择“View”|“Tests for Descriptive Stats” | “Equality Tests by Classification”选项后弹出如下图所示的对话框,在“Series/Group for classify”文本框中输入序列或
12、序列组对象名称,在“Test equality of”中选中检验方法,“NA handing”表示缺值项的处理方法,“Group into bins if”可以限定分类后子项目的数目。然后单击“OK”按钮即可。四、相关分析在EViews软件中可以对序列和序列组对象进行相关分析,从而判定序列对象是否存在自相关问题。选择“工具栏中的View”|“Correlogram”(相关图)选项,弹出右图所示的对话框。需说明的是序列组中的“View”|“Correlogram”选项分析的是第一个序列对象的相关性。如果要得到两个序列对象的交叉相关图需选择“View”|“Cross Correlogram”选项。
13、 四、相关分析在序列组对象窗口中,除了可以得到相关图外还可以得到相关矩阵。选择序列组对象窗口工具栏中的“View”|“Correlation” |“Common Sample”/“Pairwise Samples”后,得到相关矩阵表。表中的数值代表两个变量的相关性,数值可正可负。五、单位根检验单位根检验(Unit Root Test)主要用来判定时间序列的平稳性。 如果一个时间序列的均值或者协方差函数随时间变化而改变,那么这个序列就是不平稳的时间序列。如果该时间序列经过一阶差分后变为平稳序列,则称该序列为一阶单整序列,记作I(1);如果是经过d次差分后才平稳,则称为d阶单整序列,记作I(d)。
14、 五、单位根检验单位根检验(Unit Root Test)主要用来判定时间序列的平稳性。 如果一个时间序列的均值或者协方差函数随时间变化而改变,那么这个序列就是不平稳的时间序列。如果该时间序列经过一阶差分后变为平稳序列,则称该序列为一阶单整序列,记作I(1);如果是经过d次差分后才平稳,则称为d阶单整序列,记作I(d)。 五、单位根检验选择工具栏中的“View”|“Unit Root Test”选项,会弹出如下图所示的对话框。 五、单位根检验EViews5.1为用户提供了6种单位根检验的方法,有l“Augmented DickeyFuller”(ADF)检验法,l“DickeyFuller G
15、LS (ERS)”(DF)检验法,l“PhillipsPerron”(PP)检验法,l“KwiatkowskiPhillipsSchmidtShin”(KPSS)检验法,l“ElliottRothenbergStock PointOptimal”(ERS)检验法,l“NgPerron”(NP)检验法。五、单位根检验在“Test for unit root in”中选择序列形式。“Level”表示对原序列进行单位根检验,“1st difference”表示对一阶差分序列进行单位根检验,“2nd difference”表示对二阶差分序列进行单位根检验。 五、单位根检验“Lag length”表示消
16、除序列相关所需的滞后阶数,在该区域有两个选项按钮。在“Automatic selection”(自动选择)中有两个文本框,第一个文本框的下拉列表中有6个准则,常用的是“AIC”和“SC”最小准则,系统在默认状态下显示的是SC准则;第二个文本框中输入最大滞后阶数,一般系统会根据样本容量而自动给出一个数值。如果选中“User specific”,则用户可输入具体的数值,系统会给出检验结果。 五、单位根检验“Include in test equation”表示检验式中是否包含“Intercept”(截距项)、“Trend and intercept”(趋势项和截距项)和“None”(不包含趋势项和
17、截距项)。可根据图形来确定是否包含趋势项和截距项。 六、Granger因果检验Granger因果关系检验就是检验一个变量的滞后变量是否可以放入其他变量的方程中。如果该变量受到其他变量滞后期的影响,则称两个变量间存Granger因果关系。 六、Granger因果检验打开序列组对象窗口,选择工具栏中的“View”|“Granger Causality”选项,在弹出的对话框中输入滞后期,然后单击“OK”按钮,就会得到下图所示的分析结果。一般情况下Granger因果检验的滞后期要根据AIC和SC准则来确定。“Null Hypothesis”列是原假设,“CPI does not Granger Cau
18、se GDP”为CPI不是GDP的Granger因,同样,“GDP does not Granger Cause CPI”为GDP不是CPI的Granger因。“Obs”列是样本数,“FStatistic”列是检验的F统计量,“Probability”为F检验的概率值。六、Granger因果检验从上图的数据中我们可以看出,在1%的显著性水平下,CPI是GDP的Granger因(P值为0.002040.01,接受原假设)。 本章小结: 掌握图形对象生成、冻结和复制基本操作 熟悉描述性统计量及其检验方法 掌握单位根检验操作方法 掌握Granger因果检验操作方法第5章 基本回归模型的OLS估计 重
19、点内容: 普通最小二乘法 线性回归模型的估计 线性回归模型的检验一、普通最小二乘法(OLS)1.最小二乘原理设(x1,y1),(x2,y2),(xn,yn)是平面直角坐标系下的一组数据,且x1 x2 xn,如果这组图像接近于一条直线,我们可以确定一条直线y = a + bx ,使得这条直线能反映出该组数据的变化。 如果用不同精度多次观测一个或多个未知量,为了确定各未知量的可靠值,各观测量必须加改正数,使其各改正数的平方乘以观测值的权数的总和为最小。因而称最小二乘法。 一、普通最小二乘法(OLS)1.最小二乘原理设双变量的总体回归方程为yt= B1 + B2xt +t样本回归函数为yt= b1
20、+ b2xt + et其中,et为残差项, 5-3式为估计方程,b1 和b2分别为B1和B2的估计量,因而e = 实际的yt 估计的yt一、普通最小二乘法(OLS)1.最小二乘原理估计总体回归函数的最优方法是选择B1和B2的估计量b1 ,b2,使得残差et尽可能达到最小。 用公式表达即为总之,最小二乘原理就是选择样本回归函数使得y的估计值与真实值之差的平方和最小。一、普通最小二乘法(OLS)2.方程对象选择工作文件窗口工具栏中的“Object”| “New Object”| “Equation”选项,在下图所示的对话框中输入方程变量。 一、普通最小二乘法(OLS)2.方程对象EViews5.1
21、提供了8种估计方法:u“LS”为最小二乘法;u“TSLS”为两阶段最小二乘法;u“GMM”为广义矩法;u“ARCH”为自回归条件异方差;u“BINARY”为二元选择模型,其中包括Logit模型、Probit模型和极端值模型;u“ORDERED”为有序选择模型;u“CENSORED”截取回归模型;u“COUNT”为计数模型。 二、一元线性回归模型1.模型设定一元线性回归模型的形式为 yi = 0 + 1 xi + ui (i=1,2,n)其中,y为被解释变量,也被称为因变量;x为解释变量或自变量;u是随机误差项(random error term),也被称为误差项或扰动项,它表示除了x之外影响y
22、的因素,即y的变化中未被x所解释的部分;n为样本个数。二、一元线性回归模型2.实际值、拟合值和残差估计方程为 表示的是yt的拟合值, 和 分别是 0 和1的估计量。实际值指的是回归模型中被解释变量(因变量)y的原始观测数据。拟合值就是通过回归模型计算出来的yt的预测值。二、一元线性回归模型2.实际值、拟合值和残差三条曲线分别是实际值(Actual),拟合值(Fitted)和残差(Residual)。实际值和拟合值越接近,方程拟合效果越好。三、多元线性回归模型通常情况下,将含有多个解释变量的线性回归模型(多元线性回归模型)写成如下形式,yi = 0 + 1 x1i +2 x2i+3 x3i+k
23、xki + ui (i=1,2,n) 其中,y为被解释变量,也被称为因变量;x为解释变量或自变量;u是随机误差项(random error term),也被称为误差项或扰动项; n为样本个数。 三、 多元线性回归模型在多元线性回归模型中,要求解释变量x1,x2,xk之间互不相关,即该模型不存在多重共线性问题。如果有两个变量完全相关,就出现了完全多重共线性,这时参数是不可识别的,模型无法估计。 三、 多元线性回归模型通常情况下,把多元线性回归方程中的常数项看作虚拟变量的系数,在参数估计过程中该常数项始终取值为1。因而模型的解释变量个数为k+1.多元回归模型的矩阵形式为 Y = X + u其中,Y
24、是因变量观测值的T维列向量;X是所有自变量(包括虚拟变量)的T个样本点观测值组成的T(k+1)的矩阵;是k+1维系数向量;u是T维扰动项向量。四、 线性回归模型的基本假定线性回归模型必须满足以下几个基本假定: 假定1:随机误差项u具有0均值和同方差,即 E ( ui ) = 0 i=1,2,n Var ( ui ) = 2 i=1,2,n 其中,E表示均值,也称为期望,在这里随机误差项u的均值为0。Var表示随机误差项u的方差,对于每一个样本点i,即在i=1,2,n的每一个数值上,解释变量y对被解释变量x的条件分布具有相同的方差。当这一假定条件不成立是,称该回归模型存在异方差问题。 四、 线性
25、回归模型的基本假定假定2:不同样本点下的随机误差项u之间是不相关的,即 Cov(ui,uj)=0,ij,i,j=1,2,n 其中,cov表示协方差。当此假定条件不成立时,则称该回归模型存在序列相关问题,也称为自相关问题。 四、 线性回归模型的基本假定假定3:同一个样本点下的随机误差项u与解释变量x之间不相关,即 Cov(xi,ui)=0 i=1,2,n 四、 线性回归模型的基本假定假定4:随机误差项u服从均值为0、同方差的正态分布,即 u N(0,2) 如果回归模型中没有被列出的各因素是独立的随机变量,则随着这些随机变量个数的增加,随机误差项u服从正态分布。 四、 线性回归模型的基本假定假定5
26、:解释变量x1,x2,xi是非随机的确定性变量,并且解释变量间互不相关。则这说明yi的概率分布具有均值,即 E(yi|xi)= E(0 +1xi +ui)=0 +1xi该式被称为总体回归函数。如果两个或多个解释变量间出现了相关性,则说明该模型存在多重共线性问题。 五、 线性回归模型的检验1.拟合优度检验拟合优度检验用来验证回归模型对样本观测值(实际值)的拟合程度,可通过R2统计量来检验。 五、 线性回归模型的检验1.拟合优度检验公式 三者的关系为TSS = RSS +ESS TSS为总体平方和, RSS为残差平方和, ESS为回归平方和。 五、 线性回归模型的检验1.拟合优度检验总体平方和(T
27、SS)反映了样本观测值总体离差的大小,也被称为离差平方和;残差平方(RSS)说明的是样本观测值与估计值偏离的程度,反映了因变量总的波动中未被回归模型所解释的部分;回归平方和(ESS)反映了拟合值总体离差大小,这个拟合值是根据模型解释变量算出来的。五、 线性回归模型的检验1.拟合优度检验拟合优度R2的计算公式为 R2 = ESS / TSS = 1RSS / TSS当回归平方(ESS)和与总体平方和(TSS)较为接近时,模型的拟合程度较好;反之,则模型的拟合程度较差。因此,模型的拟合程度可通过这两个指标来表示。五、 线性回归模型的检验2.显著性检验变量显著性检验(t检验) 检验中的原假设为: H
28、0:i= 0,备择假设为: H1:i 0, 如果原假设成立,表明解释变量x对被解释变量y没有显著的影响;当原假设不成立时,表明解释变量x对被解释变量y有显著的影响,此时接受备择假设。 五、 线性回归模型的检验2.显著性检验方程显著性检验(F 检验) 原假设为: H0:1= 0,2= 0,k= 0,备择假设为: H1:i 中至少有一个不为 0, 如果原假设成立,表明解释变量x对被解释变量y没有显著的影响;当原假设不成立时,表明解释变量x对被解释变量y有显著的影响,此时接受备择假设。 五、 线性回归模型的检验2.显著性检验方程显著性检验(F 检验) F 统计量为 该统计量服从自由度为(k,nk1)
29、的F分布。给定一个显著性水平,当F统计量的数值大于该显著性水平下的临界值F(k,nk1)时,则在(1)的水平下拒绝原假设H0,即模型通过了方程的显著性检验,模型的线性关系显著成立。 五、 线性回归模型的检验3.异方差性检验(1)图示检验法图示检验法通过散点图来判断用OLS方法估计的模型异方差性,这种方法较为直观。通常是先将回归模型的残差序列和因变量一起绘制一个散点图,进而判断是否存在相关性,如果两个序列的相关性存在,则该模型存在异方差性。 五、 线性回归模型的检验3.异方差性检验(1)图示检验法检验步骤:l建立方程对象进行模型的OLS(最小二乘)估计,此时产生的残差保存在主窗口界面的序列对象r
30、esid中。l建立一个新的序列对象,并将残差序列中的数据复制到新建立的对象中。l然后选择主窗口中的“Quick” | “Graph” | “Scatter”选项,生成散点图,进而可判断随机项是否存在异方差性。 五、 线性回归模型的检验3.异方差性检验(2)怀特(White)检验法检验步骤:l用OLS(最小二乘法)估计回归方程,得到残差e。l作辅助回归模型:l求辅助回归模型的拟合优度R2的值。White检验的统计量服从2分布,即N R 2 2 (k)其中,N为样本容量,k为自由度,k等于辅助回归模型()中解释变量的个数。如果2值大于给点显著性水平下对应的临界值,则可以拒绝原假设,即存在异方差;反
31、之,接受原假设,即不存在异方差。 五、 线性回归模型的检验3.异方差性检验(2)怀特(White)检验法White检验的统计量服从2分布,即N R 2 2 (k)其中,N为样本容量,k为自由度,k等于辅助回归模型()中解释变量的个数。如果2值大于给点显著性水平下对应的临界值,则可以拒绝原假设,即存在异方差;反之,接受原假设,即不存在异方差。 五、 线性回归模型的检验3.异方差性检验(2)怀特(White)检验法在EViews5.1软件中选择方程对象工具栏中的“View” | “Residual Tests” | “White Heteroskedasticity”选项即可完成操作。五、 线性回
32、归模型的检验3.异方差性检验异方差性的后果 :当模型出现异方差性时,用OLS(最小二乘估计法)得到的估计参数将不再有效;变量的显著性检验(t检验)失去意义;模型不再具有良好的统计性质,并且模型失去了预测功能。 五、 线性回归模型的检验4.序列相关检验方法:(1)杜宾(D .W .Durbin-Watson)检验法 (2)LM(拉格朗日乘数Lagrange Multiplier)检验法 五、 线性回归模型的检验4.序列相关检验(1)杜宾(D .W .Durbin-Watson)检验法 J. Durbin, G. S. Watson于1950年提出了D .W .检验法。它是通过对残差构成的统计量来
33、判断误差项ut 是否存在自相关。D .W .检验法用来判定一阶序列相关性的存在。D .W .的统计量为五、 线性回归模型的检验4.序列相关检验(1)杜宾(D .W .Durbin-Watson)检验法 如果, 0 D .W . dt ,存在一阶正自相关 dt D .W . du ,不能确定是否存在自相关 du D .W . 4du ,不存在自相关 4du D .W . 4dt 不能确定是否存在自相关 4dt D .W . 4 ,存在一阶负自相关五、 线性回归模型的检验4.序列相关检验(1)杜宾(D .W .Durbin-Watson)检验法 使用D .W .检验时应注意,因变量的滞后项yt-1
34、不能作为回归模型的解释变量,否则D .W .检验失效。另外,样本容量应足够大,一般情况下,样本数量应在15个以上。五、 线性回归模型的检验4.序列相关检验(2)LM(拉格朗日乘数Lagrange Multiplier)检验法LM 检验原假设和备择假设分别为:H0:直到p阶滞后不存在序列相关H1:存在p阶序列相关LM的统计量为 LM = nR2 2( p) 其中,n为样本容量,R2为辅助回归模型的拟合优度。LM统计量服从渐进的2(p)。在给定显著性水平的情况下,如果LM统计量小于设定在该显著性水平下的临近值,则接受原假设,即直到p阶滞后不存在序列相关。 五、 线性回归模型的检验4.序列相关检验序
35、列相关性的后果:l用OLS(最小二乘估计法)得到的估计参数将不再有效;l变量的显著性检验(t检验)失去意义;l模型不再具有良好的统计性质,并且模型失去了预测功能。五、 线性回归模型的检验5.多重共线性方法:(1)相关系数检验法 (2)逐步回归法五、 线性回归模型的检验5.多重共线性(1)相关系数检验法在群对象窗口的工具栏中选择“View” | “Correlations” | “Common Sample”选项,即可得到变量间的相关系数。 如果相关系数较高,则变量间可能存在线性关系,即模型有多重共线性的可能。五、 线性回归模型的检验5.多重共线性(2)逐步回归法当在回归模型中增加或减少解释变量
36、个数时,如果拟合优度变化很大,说明新引进的变量是一个独立的解释变量,即它与其他变量间是相互独立的,模型不存在多重共线性;如果拟合优度变化不大,说明新引进的变量不是一个独立的解释变量,它可由原有的解释变量的线性组合构成,即它与其他变量间非相互独立,模型可能存在多重共线性。 五、 线性回归模型的检验4.序列相关检验消除多重共线性方法:l剔除法l差分法 本章小结: 掌握线性回归模型的基本原理 掌握回归模型的检验方法 熟练各检验的EViews相关操作第6章单方程模型的其他估计方法重点内容: 加权最小二乘法(消除异方差) 广义最小二乘法(消除序列相关和异方差) 广义矩估计一、加权最小二乘法(WLS)1.
37、异方差问题的解决当线性回归模型出现异方差时,所得到的估计量是非有效的。用加权最小二乘法(WLS)可以解决异方差问题。基本思路基本思路:赋予每个观测值残差不同的权数,从而使得回归模型的随机误差项具有同方差性。 一、加权最小二乘法(WLS)1.异方差问题的解决基本原理基本原理:设一元线性方程为 yt =0 +1xt +t 如果随机误t差项的方差Var(t)与解释变量成比例关系,即 Var(t) = t2 = f(xt)2 说明随机误差项的方差与解释变量xt之间存在相关性,即存在异方差问题。 一、加权最小二乘法(WLS)1.异方差问题的解决消除方法:消除方法:用用 乘以一元线性方程的两端乘以一元线性
38、方程的两端,得yt = 0 + 1xt + t则,Var( t) = E( t)2 = E(t)2 = 2 从而,消除了异方差,随机误差项同方差。这时再用普通最小二乘法(OLS)估计其参数,得到有效的0,1估计量。 一、加权最小二乘法(WLS)1.异方差问题的解决消除方法消除方法(EViewsEViews操作)操作)(1 1)用最小二乘法()用最小二乘法(OLSOLS)估计方程,得到残差序列;)估计方程,得到残差序列;(2 2)根据残差序列计算出加权序列;)根据残差序列计算出加权序列;(3 3)选择)选择EViewsEViews主菜单栏中的主菜单栏中的“QuickQuick”| | “Esti
39、mate Estimate EquationEquation”选项,弹出下图所示的对话框。选项,弹出下图所示的对话框。 包括两个选项卡: (1)“Specification”选项卡 (2 2)“OptionsOptions”选项卡选项卡 一、加权最小二乘法(WLS)1.异方差问题的解决消除方法消除方法(EViewsEViews操作)操作)在“Specification”选项卡的“Equation specification”文本框中输入用OLS(普通最小二乘法)估计的方程。 在“Options”选项卡中,选中“Weighted LS/TSLS”复选框,并在“Weighted”的文本框中输入加权
40、序列的名称,例如输入“w”。 加权序列“w ”用OLS估计模型时得到的残差序列的绝对值的倒数序列。填好后再单击“确定”按钮二、广义最小二乘法(GLS)广义最小二乘法广义最小二乘法(Generalized Least Squared,GLS)常用来对存在序列相关和异方差的模型进行估计。普通常用来对存在序列相关和异方差的模型进行估计。普通最小二乘法最小二乘法(OLS)和加权最小二乘法和加权最小二乘法(WLS)是广义是广义最小二乘法最小二乘法(GLS)的特例)的特例。 二、广义最小二乘法(GLS)基本原理:基本原理:通过变换原回归模型,使随机误差项消除自相关,进而利用普通最小二乘法估计回归参数 。设
41、原回归模型是 yt = 0 + 1x1t + 2 x2t+ kxkt +ut (t = 1, 2, , n )(1) 其中,ut具有一阶自回归形式 ut = ut1 + vt (2)vt 满足线性回归模型的基本假定条件,把(2)式代入(1)式中,得 yt = 0+1x1t+2x2t+0xkt+ut 1 + vt (3)二、广义最小二乘法(GLS)基本原理:基本原理:再求模型(3)的滞后1期即(t1)期的回归模型,并在两侧同乘 yt1= 0 + 1x1t1 +2x2t1 +kxkt1+ ut1 (4)用(2)式与(4)相减,得 ut yt1 = 0 (1)+1(x1tx1t1)+ +k(xk1
42、xkt1) + vt (5) 令 yt* = yt yt 1 xjt* = xjt xjt 1, j = 1 , 2 , k (6) 0* = 0 (1 ) 则yt* = 0*+ 1 x1 t* + 2 x2 t* + + k xk t* + vt 如果模型不存在异方差和序列相关,则使用广义最小二乘法等于普通最小二乘法。 三、两阶段最小二乘法(TSLS)基本原理:基本原理:两阶段最小二乘法分两个阶段:第一阶段第一阶段:找到工具变量,用最小二乘估计法(OLS)对模型中的每一解释变量与工具变量做回归;第二阶段第二阶段:用第一阶段的拟合值代替内生变量,对原方程进行第二次回归,这次回归得到的系数就是用
43、两阶段最小二乘法得到的新估计值。 三、两阶段最小二乘法(TSLS)EViewsEViews操作:操作:选择主菜单栏中的“Object”| “New Object” | “Equation”选项,或者选择“Quick”| “Estimate Equation” 选项,在打开的方程对话框的“Method”种选择“TSLS”法,会得到如下对话框。 三、两阶段最小二乘法(TSLS)EViewsEViews操作:操作:在上图的方程设定(Equation specification)的文本框中列出解释变量和被解释变量,在工具变量列表(Instrument list)的文本框中输入工具变量。 在进行两阶段最
44、小二乘估计时,方程中的工具变量数至少要与估计系数相等。常数项常常用来做工具变量。 四、非线性最小二乘法(NLS)非线性模型包括可线性化的非线性模型和不可线性化的非线性模型。可线性化的模型是指该模型可以通过线性化的处理变为线性模型,如一元二次方程,幂函数等。 例如:y =axb lny =lna+blnx 即 y=a+bx 并非所有的函数均可被线性化,能被线性化的可以继续用OLS等线性回归模型适用的方法进行估计,不能被线性化的模型就可以用非线性最小二乘法(Nonlinear Least Square,NLS)进行估计。 四、非线性最小二乘法(NLS)基本原理基本原理: 设定非线性回归模型的一般式
45、为 yi = f(xi, ,) + i i=1,2,,n (1)则其残差平方和为 S ( ) = (2) 能使(2)达到最小的为参数的非线性最小二乘估计。要得到的估计值,首先对式(1)中的求偏导,然后令该式等于0。还可以通过迭代法求的近似值,先给出参数估计的初始值,然后通过迭代法得到一个新的估计值,重复迭代直到估计值收敛为止。四、非线性最小二乘法(NLS)EViews操作操作: 选择主菜单栏中 “Object”|“New Object”|“Equation”选项,或者选择“Quick”|“Estimate Equation” 选项,打开方程设定对话框,在“Equation specificat
46、ion”中输入非线性模型的表达式,如“y c 1/x”,即为双曲线的回归模型。EViews软件会自动用非线性最小二乘法(NLS)进行估计,因而建立方程时,只输入非线性表达式即可。例如y =axb ,只需输入“y= c(1)*xc(2)”即可。 五、广义矩估计(GMM)广义矩估计法(Generalized Method of Moments,GMM)则可以不受模型假定的限制,它不要求随机扰动项一定非序列相关,不存在异方差等,并且所得到的参数估计值比用其他估计方法得到的参数估计值更与实际接近。广义矩估计法(GMM)是一个大样本估计,其估计量在大样本下有效,在小样本下无效。 五、广义矩估计(GMM)
47、基本原理基本原理:广义矩估计是设定参数满足的一种理论关系。其原理是选择参数估计尽可能接近理论上关系,把理论关系用样本近似值代替;并且估计量的选择就是要最小化理论值和实际值之间的加权距离。参数要满足的理论关系通常是参数函数f()与工具变量Zt之间的正则条件,即Ef()Z=0,是被估计参数 广义矩估计法(GMM)中估计量选择的标准是,使工具变量与函数f()之间的样本相关性越接近于0越好。 五、广义矩估计(GMM)EViews基本操作基本操作:选择主菜单栏中 “Object”|“New Object”|“Equation”选项,或者选择“Quick”|“Estimate Equation” 选项,在
48、“Method”中选择“GMM”后弹出如下图所示的方程设定对话框。 五、广义矩估计(GMM)EViews基本操作基本操作:选择主菜单栏中 “Object”|“New Object”|“Equation”选项,或者选择“Quick”|“Estimate Equation” 选项,在“Method”中选择“GMM”后弹出如下图所示的方程设定对话框。 在“Equation specification”(方程设定)中列出方程的被解释变量和所有解释变量(包括常数项),在“Instrument list”(工具变量列表)中,列出工具变量名。注意:工具变量的个数不能比被估计参数的个数少,否则广义矩估计法(G
49、MM)的估计量不可识别。同样,在这里常数项会被自动加入工具变量列表中。 本章小结: 了解WLS、GLS、NLS、TSLS、GMM五种估计方法的基本原理 掌握这五种估计法的EViews相关操作第7章 含虚拟变量的回归模型 重点内容: 虚拟变量的定义 定性变量与定量变量的划分 含虚拟变量模型的估计一、虚拟变量的定义1.定性变量与定量变量定量变量:定量变量:回归模型中有些变量是可以被度量的,如居民消费、国内生产总值、出口总额等,这些变量被称为“定量变定量变量量”。定性变量定性变量:在经济现象的分析中还存在一些不能被度量的变量,如性别、种族、婚姻状况、文化程度等,这些变量被称为“定性变量定性变量”。
50、一、虚拟变量的定义2.虚拟变量定义定义:定性变量描述的是变量具有的性质,要将这样的变量纳入回定性变量描述的是变量具有的性质,要将这样的变量纳入回归模型中,需构造人工变量,从而将定性变量进行量化处理。归模型中,需构造人工变量,从而将定性变量进行量化处理。在计量经济学中,将取值为在计量经济学中,将取值为“0”和和“1” 的人工变量称作的人工变量称作虚拟变量(虚拟变量(Dummy Variable),用字母),用字母D表示。当表示。当D取值为取值为0时,表示该变量不具备某种属性;当时,表示该变量不具备某种属性;当D取值为取值为1时,表示该时,表示该变量具有某种属性。变量具有某种属性。 一、虚拟变量的
51、定义2.虚拟变量虚拟变量陷阱虚拟变量陷阱:所谓的所谓的“虚拟变量陷阱虚拟变量陷阱”是指自变量(解释变量)中包含了是指自变量(解释变量)中包含了过多的虚拟变量,从而导致了模型出现多重共线性。当模型过多的虚拟变量,从而导致了模型出现多重共线性。当模型中既有整体截距又对每一组都设有一个虚拟变量时,就产生中既有整体截距又对每一组都设有一个虚拟变量时,就产生了虚拟变量陷阱。了虚拟变量陷阱。一、虚拟变量的定义2.虚拟变量引入虚拟变量的原则引入虚拟变量的原则:一般情况下,如果定性变量有一般情况下,如果定性变量有m类,并且模型不含有截距项类,并且模型不含有截距项时,应引入时,应引入m个虚拟变量;如果模型含有截
52、距项,应引入个虚拟变量;如果模型含有截距项,应引入m-1个虚拟变量。个虚拟变量。二、含虚拟变量的模型1.仅含一个虚拟变量在回归模型中,解释变量可以仅是一个虚拟变量,这样的回在回归模型中,解释变量可以仅是一个虚拟变量,这样的回归模型被称为方差分析模型。归模型被称为方差分析模型。 例如:yt =0 + 1Dt + t 假设被解释变量yt为员工工资收入,Dt为虚拟解释变量,取值为0或1: 1,雇员为女性,雇员为女性Dt= 0,雇员为男性,雇员为男性二、含虚拟变量的模型1.仅含一个虚拟变量如果该回归模型的随机误差项满足线性回归模型的五个基本假定条件,则E(yt| Dt=1)= E(雇员工资收入|雇员为
53、女性)=0 + 1E(yt| Dt=0)= E(雇员工资收入|雇员为男性)=00 + 1表示女性雇员的平均工资收入,0表示男性雇员的平均工资收入。二、含虚拟变量的模型1.仅含一个虚拟变量实验:根据表71中的数据显示,建立解释变量为虚拟变量的回归模型。表中列出了24个不同性别的企业员工的月工资收入情况,性别一列中“1”表示女性员工,“0”表示男性员工。通过建立含有虚拟变量的回归模型,试图分析男女平均工资是否存有差距,如果有差距,那么差距是多少。 二、含虚拟变量的模型1.仅含一个虚拟变量实验:回归模型为yt =0 + 1Dt + t (t=1,2,n)其中,yt表示企业员工的工资收入情况,Dt=0
54、表示男性员工,Dt=1表示女性员工。二、含虚拟变量的模型1.仅含一个虚拟变量实验:第一步,建立类型为“Unstructured/Undated”(未限定结构/未限定日期)的工作文件,在“Data range”(数据范围)中输入观测数据的样本范围,本例中所分析的数据为24个样本,在“Names”中为该工资文件命名,如“工资与性别关系”。然后单击“OK”按钮即可生成工作文件。 二、含虚拟变量的模型1.仅含一个虚拟变量实验:第二步,在该工作文件中建立两个序列对象,一个为“wage”,一个为“sex”。第三步,在“wage”序列对象中输入 “工资”的数据,在“sex”序列对象中输入 “性别”的数据。二
55、、含虚拟变量的模型1.仅含一个虚拟变量实验:第四步,在工作文件中选择主菜单栏中的“Object”| “New Object” | “Equation”选项,或者选择“Quick”| “Estimate Equation” 选项,打开如下所示的方程对话框。二、含虚拟变量的模型1.仅含一个虚拟变量实验:在“Equation specification”(方程说明)中列出模型中的被解释变量、常数项和解释变量。在“Estimation settings”(估计方法设定)中选择“LS”,用普通最小二乘法对回归模型进行估计。然后单击“确定”按钮即可得到如下估计结果。二、含虚拟变量的模型1.仅含一个虚拟变量
56、实验:虚拟变量的回归方程结果可以表示为:Wage = 3478.869 595.0965 sext= (30.06899) (3.482241)R2 = 0.35533 Adjusted R2 = 0.326027 F=12.126 D.W.=2.232989结果表明,该企业的女性员工的平均工资水平为2883.7725(3478.869595.0965)元人民币,该企业的男性员工的平均工资水平为3478.869元人民币。由此可见,女性的平均工资比男性少了595.0965元。二、含虚拟变量的模型2. 同时含虚拟和定量解释变量当方程的解释变量中既有虚拟变量又有定量变量时,同样可当方程的解释变量中既
57、有虚拟变量又有定量变量时,同样可以用以用OLS对模型进行估计。例如:对模型进行估计。例如:yt =0 + 1 xt+2Dt + t 二、含虚拟变量的模型2. 同时含虚拟和定量解释变量实验实验:随着科技的进步和人民生活水平的不断提高,电脑越来越普及,许多家庭纷纷把个人电脑(PC机)搬进家中。我们可以研究人们的收入水平、受教育程度与城乡居民之间的关系。模型如下,yt =0 + 1 xt+2D2t +3D3t + t (t=1,2,n)其中,yt表示根据调查资料所得到的家庭所购买个人电脑情况,xt表示家庭收入, D2 和D3为虚拟解释变量。 二、含虚拟变量的模型2. 同时含虚拟和定量解释变量实验实验
58、: 1,大专及以上学历,大专及以上学历D2 = 0,其他,其他 1,城镇居民,城镇居民D3 = 0,非城镇居民,非城镇居民根据表72中的数据用普通最小二乘法(OLS)对模型进行估计,并分析回归结果。二、含虚拟变量的模型2. 同时含虚拟和定量解释变量操作步骤操作步骤:第一步,建立类型为“Unstructured/Undated”(未限定结构/未限定日期)的工作文件。第二步,在该工作文件中建立四个序列对象。 “pc” 代表家庭拥有的电脑数量;“rev”代表家庭每月收入;“edu”代表教育程度;“city”表示城乡居民情况。并把相应的数据输入到每个序列对象中。二、含虚拟变量的模型2. 同时含虚拟和定
59、量解释变量操作步骤操作步骤:第三步,在工作文件中选择主菜单栏中的“Object”| “New Object” | “Equation”选项,打开方程对话框。在“Equation specification”(方程说明)中输入“pc c rev edu city ”或“pc=c(1)+c(2)*rev+c (3) *edu+c (4) *city”,在“Estimation settings”(估计方法设定)中选择“LS”。二、含虚拟变量的模型2. 同时含虚拟和定量解释变量操作步骤操作步骤:第四步,结果分析。 右图中,变量edu和变量city没有通过显著性(t)检验,说明这两个变量对因变量pc的
60、影响不显著。因而,在所调查的样本中,被调查者的受教育程度以及是否是城镇居民对拥有个人电脑的数量没有显著的影响。 三、用虚拟变量法进行季节调整在使用虚拟变量法对时间序列进行季节性调整时,可以计算在使用虚拟变量法对时间序列进行季节性调整时,可以计算出每个季节对经济变量的影响。出每个季节对经济变量的影响。假设模型含有截距项,则四个季节包含了假设模型含有截距项,则四个季节包含了4种分类,因而需种分类,因而需要引入要引入3个虚拟变量(个虚拟变量(41)。用)。用Qi表示第表示第i个季度取值为个季度取值为1,其他季节取值为,其他季节取值为0这样一个虚拟变量,则这样一个虚拟变量,则Q1 + Q2 + Q3
61、+ Q41。当时间序列的数据样本为月度数据时,建立虚拟变。当时间序列的数据样本为月度数据时,建立虚拟变量的方法与季度数据相同,只是如果模型含有截距项,则月量的方法与季度数据相同,只是如果模型含有截距项,则月度数据要建立度数据要建立11个虚拟变量。个虚拟变量。本章小结: 理解虚拟变量的定义 掌握引入虚拟变量的方法 掌握含虚拟变量模型的建立方法第8章 时间序列模型 重点内容: 时间序列的分解方法 随机过程的定义 AR、MA、ARMA模型的建立方法 协整理论 误差修正(ECM)模型的建立一、时间序列的趋势分解时间序列的分解方法包括两种: 季节调整(适用于趋势要素与循环要素不可分时) 趋势分解(适用于
62、趋势要素和循环要素可分解时 )一、时间序列的趋势分解趋势分解趋势分解HP(Hodrick Prescott)滤波法)滤波法 设时间变量Yt含有趋势因素和波动因素,令Yt = YtT+ YtC (t=1,2,T)其中, YtT表示含有趋势因素的时间序列, YtC表示含有波动因素的时间序列。HP滤波法就是将时间序列Yt中YtT的分离出来。设 min HP滤波就是求该式的最小值。HP滤波取决于参数,当=0时,符合最小化的趋势序列为Yt序列;当逐渐变大时,估计的趋势变得越来越光滑;当接近于时,估计的趋势接近于线性函数。一、时间序列的趋势分解趋势分解趋势分解HP(Hodrick Prescott)滤波法
63、)滤波法 EViews操作方法:选择序列对象工具栏中的“Proc”|“Hodrick Prescott Filter”选项,将弹出右图所示的对话框。在“Smoothed”的编辑栏中输入趋势序列名在“Lambda”的编辑栏中输入参数的值,如果是年度数据输入100,如果是季度数据输入1600,如果是月度数据输入14400。然后单击“OK”按钮,就会得到原序列和趋势序列的图形。 二、时间序列的指数平滑EViews操作方法:选择序列对象工具栏中的“Proc”|“Hodrick Prescott Filter”选项,就可以弹出指数平滑法的对话框,如下图所示。在“Smoothing method”中选择方
64、法;在“Smoothing parameters”中写入平滑参数,如果输入字母E,系统会自动估计参数; 在“Smoothed series”输入平滑后的序列名称。三、随机过程分类分类:白噪声(White Noise)过程随机游走(Random Walk)过程。 三、随机过程分类分类:白噪声过程白噪声过程是指,对于随机过程xt,tT,如果 E (xt) = 0 Var(xt)= 2 Cov (xt,xt+s) =0 其中,tT,(t+s)T,s0,此时xt为白噪声过程。白噪声过程是平稳的随机过程,其均值为0,方差为常数,随机变量间不相关。白噪声源于物理学,指功率谱密度在整个频域内均匀分布的噪声。
65、 三、随机过程分类分类:白噪声过程白噪声过程是指,对于随机过程xt,tT,如果 E (xt) = 0 Var(xt)= 2 Cov (xt,xt+s) =0 其中,tT,(t+s)T,s0,此时xt为白噪声过程。白噪声过程是平稳的随机过程,其均值为0,方差为常数,随机变量间不相关。三、随机过程分类分类:白噪声过程白噪声源于物理学,指功率谱密度在整个频域内均匀分布的噪声。 时间序列xt白噪声过程图形 三、随机过程分类分类:随机游走过程随机游走过程是指,时间序列中下个时期的值等于本期值加上一个独立的(或至少是不相关的)误差项。在最简单的随机游走中,xt的每一次变化均来自于前期xt1的变化,其表达式
66、为 xt = xt 1 + ut (89)其中,ut为平稳的随机过程,即为白噪声过程,xt为随机游走过程。三、随机过程分类分类:随机游走过程时间序列xt随机游走过程图形四、时间序列模型的分类1、自回归(AR)模型时间序列xt 的p阶自回归(AR,Auto Regressive)模型的表达式为 xt = c+1xt1 + 2 xt2 + + p xtp+ ut其中,参数c为常数;1,2, ,p为自回归模型的系数,是待估参数;p为自回归模型的阶数;ut为白噪声序列,其均值为0,方差为2。称xt为p阶自回归过程,用AR(p)表示。自回归模型AR(p)常用来修正随机误差项ut的序列相关 四、时间序列模
67、型的分类2、移动平均(MA)模型时间序列xt 的q阶移动平均(MA,Moving Average)模型的表达式为 xt = c + ut +1 ut 1 +2 ut 2 + +q ut q 其中,参数c为常数;1,2,q为移动平均模型的系数,是模型的待估参数;q为移动平均模型的阶数;ut为白噪声序列,其均值为0,方差为2。称xt为q阶移动平均过程,用MA(q)表示。 时间序列xt 由1个ut和q个ut的滞后项加权的和组成,“移动”是指时间t的变化,“平均”指的是ut滞后项的加权和。 四、时间序列模型的分类3、自回归移动平均(ARMA)模型自回归移动平均模型是由自回归模型AR(p)和移动平均模型
68、MA(q)共同组成的随机过程,因而也被称为混合模型,记作ARMA(p, q)。其表达式为xt =c+1xt1 + 2 xt2 + +p xtp+ ut +1 ut1 +2 ut2 + +qut q其中,p和 q分别表示自回归模型和移动平均模型的最大阶数。当p=0时,自回归移动平均模型ARMA(0, q)= MA(q);当q=0时,自回归移动平均模型ARMA(p, 0)= AR(p)。 四、时间序列模型的分类3、自回归移动平均(ARMA)模型ARMA模型的识别 在EViews软件中,通过分析序列的相关图判断ARMA(p,q)模型的p与q的阶数。在主菜单栏中选择“Quick”|“Series St
69、atistics” |“Correlogram”选项,在弹出的文本框中输入序列对象的名称;或者打开序列对象窗口,选择序列对象工具栏中的“View”|“Correlogram”选项,均会弹出对话框。 四、时间序列模型的分类3、自回归移动平均(ARMA)模型ARMA模型的识别 “Level”表示原序列,“1st difference”表示一阶差分序列,“2st difference”表示二阶差分序列。“Lags to include”中输入最大滞后期k(季度数据,最大滞后期为4、8等;月度数据,最大滞后期为12、24等)单击“OK”按钮即可得到序列对象的相关图和Q统计量。 四、时间序列模型的分类3
70、、自回归移动平均(ARMA)模型ARMA模型的识别 在ARMA模型的识别中,如果自相关函数(AC)在p期后显著趋于0,偏自相关函数(PAC)在q期后显著趋于0,则建立ARMA(p,q)模型。四、时间序列模型的分类4、自回归单整移动平均模型ARMA(p,d,q)经 过 d次 差 分 后 变 换 的 ARMA( p,q) 模 型 为ARIMA(p,d,q)模型(Autoregressive Integrated Moving Average)。ARIMA(p,d,q)模型的估计过程与ARMA(p,q)模型基本相同,不同的是在估计ARIMA(p,d,q)模型时需确定原序列的差分阶数d,并对xt进行d
71、阶差分。因而在构建模型前需通过单位根检验来确认时间序列是否平稳,以及含有的单位根的个数。五、协整和误差修正模型1、协整 非平稳的时间序列的线性组合可能是平稳序列,我们把这种组合后平稳的序列称为协整方程,并且这些非平稳的经济变量间具有长期稳定的均衡关系。协整可以用来描述两个及两个以上的序列之间的平稳关系。 假如非平稳(有单位根)时间序列的线性组合是平稳的,即I(0),则这些变量间有协整关系。 五、协整和误差修正模型1、协整 EG两步 检验法:第一步:检验非平稳的序列是否是同阶单整,如果是同阶单整再建立回归方程,为 yt=0+1x1t+2x2t+k x kt+t 估计后得到的残差为 t = yt
72、0 1x1t 2x2t kxkt第二步:检验残差序列t的平稳性。若残差序列不平稳,即存在单位根,tI(1),则回归方程的k+1个变量间协整关系不存在。如果残差序列平稳,即不存在单位根,tI(0),则k+1个变量间协整关系存在。五、协整和误差修正模型1、协整 EG两步 检验法(EViews操作):第一步:对变量inc与cj进行单位根检验。打开序列对象,在工具栏中选择“View”|“Unit Root Test”选项。“Test type”中选择ADF(Augmented Dickey Fuller)检验法;“Test for unit root in”中选择“Level”原序列形式;“Inclu
73、de in test equation”选择“Trend and intercept”(趋势项和截距项)。然后单击“OK”按钮 五、协整和误差修正模型1、协整 EG两步 检验法(EViews操作):第二步:用最小二乘法对回归模型进行估计。选择EViews主菜单栏中的“Quick”| “Estimate Equation”选项,在弹出的对话框中输入变量名,然后单击“OK”按钮。系统默认下使用最小二乘法(OLS)进行估计。此时,回归模型估计后的残差保存在默认序列对象resid中。五、协整和误差修正模型1、协整 EG两步 检验法(EViews操作):第三步:第三步,检验残差序列的平稳性。 建立新序列
74、对象e,将残差序列resid中的数据复制到序列e中。对序列e进行单位根检验。 如果残差序列是平稳的,即不存在单位根。则变量之间协整关系存在。五、协整和误差修正模型2、误差修正模型(ECM)误差修正模型是根据一阶自回归分布滞后模型生成的,如一阶分布滞后模型为yt=0+1yt1+2xt +3xt1 +t 在上式的两端同时减去yt1,再在等式的右侧加减2 xt1,整理可得,yt=0+(11)yt1+2xt +(2+3)xt1 +t yt=(11) + xt1+yt1 +2xt +t 该式即为误差修正模型。 误差修正模型中描述了被解释变量的短期波动yt情况。 五、协整和误差修正模型2、误差修正模型(E
75、CM)EViews操作第一步:检验变量间是否存在协整关系,如存在可建立ECM模型。第二步:选择主菜单工具栏中的“Quick”| “Estimate Equation”选项,在弹出的文本框中输入误差修正模型的变量,用最小二乘法(OLS)进行估计,单击“确定”按钮即可得到误差修正模型的估计结果。 本章小结: 了解随机过程的基本概念 了解随机游走和白噪声过程的不同 掌握ARMA模型的建立方法 掌握协整理论和检验方法 掌握误差修正模型的理论和建立方法第9章 条件异方差模型 重点内容: ARCH模型的建立 GARCH模型的建立一、自回归条件异方差模型(ARCH)1.ARCH模型自回归条件异方差(ARCH
76、,Autoregressive Conditional Heteroskedasticity)模型常用来对模型的随机误差项ut进行构建模型,从而使残差序列称为白噪声序列。 一、自回归条件异方差模型(ARCH)1.ARCH模型基本原理基本原理:设xt的自回归AR(p)形式为xt=0+1 xt1+2 xt2 +P xtP + ut 则随机误差项ut的方差为Var(ut)=t2 = E(ut2) = 0 + 1 + 2 + + q +t其中,回归模型的参数0,1, q均为非负数,这样才能保证方差t2为正。我们称这里的随机误差项ut服从q阶的ARCH过程,记作utARCH(q)。 一、自回归条件异方差
77、模型(ARCH)2.ARCH模型检验(1)ARCH LM检验法(2)残差平方的相关图(Q)检验法一、自回归条件异方差模型(ARCH)2.ARCH模型检验(1)ARCH LM检验法ARCH LM检验法就是检验残差序列中是否存有ARCH效应的拉格朗日乘数的检验。若 模 型 的 随 机 误 差 项 服 从 q阶 的 ARCH过 程 , 即 utARCH(q),则可建立辅助回归方程,如下检验残差序列是否存在存在ARCH效应,即检验式93中的回归系数是否同时为0。 一、自回归条件异方差模型(ARCH)2.ARCH模型检验(1)ARCH LM检验法ARCH LM检验的原假设为:H0:1 = 2 = = q
78、 =0 (不存在ARCH效应) ARCH LM检验的备择假设为: H1:1,2,q 不全为0(存在ARCH效应) 检验的统计量为:LM = n R2 2 (q)其中,n为样本数据的数量,R2为辅助回归的拟合优度值。当给定显著性水平和自由度q时,如果LM 2 (q) 则拒绝原假设H0,即残差存在ARCH效应。一、自回归条件异方差模型(ARCH)2.ARCH模型检验(1)ARCH LM检验法在EViews操作中,要实现回归模型的ARCH LM效应检验,需 在 方 程 对 象 窗 口 中 选 择 “View”|“Residual Tests”|“ARCH LM Test”选项。 一、自回归条件异方差
79、模型(ARCH)2.ARCH模型检验(2)残差平方的相关图(Q)检验法 从残差平方的相关图可以看出残差平方的序列直到指定阶数的自相关(AC)和偏自相关(PAC)的系数。 通过残差平方的相关图可检验残差序列对象是否存在ARCH效应。当自相关和偏自相关系数在所有滞后阶数都显著为0时,残差序列不存在ARCH效应;当自相关和偏自相关系数在所有滞后阶数都不显著为0时,残差序列存在ARCH效应。 一、自回归条件异方差模型(ARCH)2.ARCH模型检验(2)残差平方的相关图(Q)检验法在EViews操作中,要实现残差平方的相关图(Q)检验,需在 方 程 对 象 窗 口 中 选 择 “View”|“Resi
80、dual Tests”|“Correlogram Q statistics”选项。 一、自回归条件异方差模型(ARCH)3.ARCH模型的建立 选 择 工 作 文 件 工 具 栏 中 的 “Object”|“New Object”|“Equation”选项。在“Estimation settings”区域的“Method”下 拉 菜 单 中 选 择 “ARCH Autoregressive Conditional Heteroskedasticity”选项,弹出下图所示的对话框。 一、自回归条件异方差模型(ARCH)3.ARCH模型的建立“Specification”(设定)选项卡(设定)选项
81、卡 在“Mean equation”的文本框中输入均值方程的形式。 在“Variance and distribution specification”(变量和分布设定)区域中,“Model”的下拉菜单有四个模型可供选择。分 别 是 “GARCH/TARCH”、 “EGARCH”、 “PARCH” “Component ARCH(1,1)”。 在“Options”中输入ARCH和GARCH的阶数 。在“Variance”的编辑栏中可列出方差方程中的外生变量。 一、自回归条件异方差模型(ARCH)3.ARCH模型的建立Options选项卡选项卡如果选中“Backcasting”(回推)中的复选框
82、,MA初始扰动项和GARCH项中的初始预测方差将使用回推(“Backcasting”)方法确定初始值。 一、自回归条件异方差模型(ARCH)3.ARCH模型的建立Options选项卡选项卡在“Derivatives”(导数方法)中,有两种计算导数的方法,分别是“Accuracy”和“Speed”。如果选择“Accuracy”计算的精度会更高,如果选择“Speed”计算的速度会更快。在“Iterative process”(迭代过程)中可设定最大迭代次数,调整收敛准则,这些都可以对迭代进行控制。在“Optimization algorithm”(优化算法)中“Marquardt”(马夸特测定法)
83、和“BHHH”两种方法,通过调整优化算法也可以进行迭代控制。二、广义自回归条件异方差模型(GARCH)1.GARCH模型广基本模型为广基本模型为称随机误差项ut服从p阶GARCH(p,q)过程,记作utGARCH(p,q)。 二、广义自回归条件异方差模型(GARCH)1.GARCH模型GARCH(1,1)模型是比较常用的一种,括号中的第一个数值为GARCH项的阶数,第二数值为ARCH项的阶数。其基本形式为GARCH(1,1)模型在金融领域应用广泛,可以对金融时间序列的数据进行描述。 二、广义自回归条件异方差模型(GARCH)2.GARCH模型的建立当上述辅助回归方程进行ARCH效应检验时,如果
84、ARCH的滞后阶数q很大,检验结果依然显著,即残差序列依然存在ARCH(q)效应。此时可采用GARCH(p,q)模型重新进行估计。EViews中GARCH模型建立的方法与ARCH模型相似,不同的是在设定对话框中“GARCH”项的编辑框中输入p值即可。 三、ARCH模型的其他扩展形式1. ARCH-M模型ARCHM(ARCHinMean)模型就是利用条件异方差表示预期风险的模型,也被称为ARCH均值模型。其方程形式为其中,参数是用条件异方差t2衡量的,反映了预期风险波动对yt的影响程度。 三、ARCH模型的其他扩展形式1. ARCH-M模型 ARCHM模型常用来分析资产的预期收益与预期风险间的关
85、系。一般情况下,资产的风险越大,其收益率越高,而条件方差ht代表了期望风险的大小。 要建立ARCHM模型就是在条件方差方程中加入条件方差ht、条件标准差或条件方差的对数log(ht) 形式,其他内容与GARCH模型的建立相同。三、ARCH模型的其他扩展形式2. TARCH模型 TARCH(Threshold ARCH)模型是门限自回归条件异方差模型,可用来分析数据的剧烈波动性。模型中条件方差的形式为其中,dt1是一个虚拟变量,满足的条件为 1 ,如果t1=0三、ARCH模型的其他扩展形式2. TARCH模型 ARCH模型是一个非对称的ARCH模型,当不为0时,就存在非对称效应。因而条件方差方程
86、中的dt1项被称为非对称效应项,也称为TARCH项。 t2与两个因素有关:一个是前期残差的平方,一个是条件方差。t10代表经济中好的信息。 三、ARCH模型的其他扩展形式2. TARCH模型在EViews软件中,打开条件异方差的方程设定对话框,在“Threshold”编辑框中输入1,其他内容的设定与GARCH(1,1)模型相同。然后单击“确定”按钮即可得到TARCH模型的估计结果。三、ARCH模型的其他扩展形式3. TARCH模型EGARCH(Exponential GARCH)模型是指数GARCH模型,模型中条件方差表达式为只要等式右侧的不等于0,冲击的影响就存在非对称性。 三、ARCH模型
87、的其他扩展形式3. TARCH模型在EViews软件中,打开条件异方差的方程设定对话框,在“Model”的 下 拉 菜 单 中 选 择 “EGARCH”项 , 同 时“Threshold”选项变为“Asymmetric”,在该编辑框中输入1,表示EGARCH模型中含有一个非对称项。其他内容的设定与GARCH(1,1)模型相同。然后单击“确定”按钮即可得到EGARCH模型的估计结果。 本章小结: 掌握自回归条件异方差模型的原理 掌握ARCH、GARCH等模型的建立方法 了解ARCH-M、TARCH、EARCH模型第10章 离散因变量和受限因变量模型 重点内容: 二元选择模型的建立 排序选择模型的
88、建立 审查回归模型的建立 计数模型的建立一、二元选择模型1.二元选择模型的形式假设有一个变量yt,它与解释变量xt之间存在线性关系,即yt=1x1t +2x2t +kxkt+t (t=1,2,n)yt与yt之间的关系为 1 , 当yt0时 yt = 0 , 当yt0时一、二元选择模型1.二元选择模型的形式P(yt=1 | xt,)= P(yt 0)= P(t xt)=1F( xt)(11)P(yt=0 | xt,)= P(yt0)= P(t xt)=F( xt)(12) 式12中,F为t的连续分布函数,因而将原始的回归模型变成如下形式,yt =1F( xt)+t 一、二元选择模型1.二元选择模
89、型的形式二元选择模型的类型是由分布函数的类型决定,常用的二元选择模型有三种,如下表所示。i对应的分布 分布函数F 对应的二元选择模型 标准正态分布 (x) Probit模型 逻辑(logistic)分布 ex/(1+ ex) Logit模型 极值分布 1-exp(-ex) Extreme value模型 一、二元选择模型2.二元选择模型的建立二元选择模型一般用迭代法求极大似然函数的最大值(线性概率(Tobit)模型除外),由于在模型中因变量的取值只能是1和0,因而估计系数不能解释成解释变量对被解释变量(因变量)的边际影响,但可以从符号上进行分析。当估计系数为正时,表明解释变量越大,被解释变量取
90、值为1的概率越大;当估计系数为负时,表明解释变量越大,被解释变量取值为0的概率越大。一、二元选择模型2.二元选择模型的建立在EViews软件的操作中,要建立二元选择模型,需首先选择主菜单栏中的“Object”|“New Object”|“Equation”选项,或者选择“Quick”|“Estimate Equation” 选项,打开方程设 定 对 话 框 , 选 择 “Specification”选 项 卡 。 在“Method”的 下 拉 菜 单 中 选 择 “BINARY Binary choice(logit, probit, extreme value)”估计方法。一、二元选择模型2
91、.二元选择模型的建立在“Equation specification”中列出被解释变量、常数项和解释变量。(二元选择模型的估计只能以列表形式将方程中的变量列出,不能输入公式的形式。)在“Binary estimation”中有三个选项,分别是“Probit”、“Logit”、“Extreme value”,用户需选中三种估计方法中的一种。 一、二元选择模型2.二元选择模型的建立在“Options”选项卡中,可以设置估计算法和迭代限制。一、二元选择模型2.二元选择模型的建立 Robust Covariances”(稳健标准差)有两个选项(稳健标准差)有两个选项:l“Huber/White”为用准
92、极大似然函数方法估计标准差,l“GLM”为用广义线性模型方法估计标准差。一、二元选择模型2.二元选择模型的建立“ “Optimization algorithm”为为“最优化算法最优化算法”,包括三,包括三个运算法则:个运算法则:l“Quadratic Hill Climbing”法则是用对数似然分析二次导数 的矩阵;l“NewtonRaphson”使用二次导数;l“BHHH”使用一次导数来确定迭代更新和协方差矩阵估计。一、二元选择模型2.二元选择模型的建立“在在“Starting coefficient”中可以指定初始值中可以指定初始值:“.8 EViews”、 “.5 EViews”、 “
93、.3 EViews”分别为使用默认值的80%、50%、30%作为初始值;“Zero”为零系数;“User Supplied”为由用户提高数值。一、二元选择模型3.二元选择模型的分析二元选择模型的回归结果分析包括:二元选择模型的回归结果分析包括:l拟合优度检验拟合优度检验l异方差检验异方差检验l预测和产生残差序列预测和产生残差序列 一、二元选择模型3.二元选择模型的分析二元选择模型的回归结果分析包括:二元选择模型的回归结果分析包括:拟合优度检验拟合优度检验包括:包括:H-L(Hosmer-Lemeshow)检验)检验 Andrews检验检验 检验中通过分组对拟合值和实际值进行比较,如果两者检验中
94、通过分组对拟合值和实际值进行比较,如果两者间的差别较大,就可断定模型的拟合效果不好;如果两者间间的差别较大,就可断定模型的拟合效果不好;如果两者间的差别很小,就可认为模型的拟合效果较好。的差别很小,就可认为模型的拟合效果较好。 一、二元选择模型3.二元选择模型的分析二元选择模型的回归结果分析包括:二元选择模型的回归结果分析包括:拟合优度检验拟合优度检验EViews软件操作中,在建立好的方程对象窗口下选择软件操作中,在建立好的方程对象窗口下选择“View”|“Goodness-of-Fit Test(Hosmer-Lemeshow)”选选项,将弹出拟合优度检验的对话框。项,将弹出拟合优度检验的对
95、话框。 一、二元选择模型3.二元选择模型的分析二元选择模型的回归结果分析包括:二元选择模型的回归结果分析包括:拟合优度检验拟合优度检验在在“Group observations by”区域确定区域确定分组变量分组变量 :l当分组变量取值很多时选择“Quantiles”,l当分组变量只取少许几个值,选择“Distinct values” 。一、二元选择模型3.二元选择模型的分析二元选择模型的回归结果分析包括:二元选择模型的回归结果分析包括:预测预测在方程对象工具栏中选择在方程对象工具栏中选择“Proc”|“Forecast(Fitted Probability/Index)”选项,或者选择工具栏
96、中的选项,或者选择工具栏中的“Forecast”功能键,弹出预测对话框。功能键,弹出预测对话框。 一、二元选择模型3.二元选择模型的分析二元选择模型的回归结果分析包括:二元选择模型的回归结果分析包括:预测预测l“Forecast equation”中输入待预测的方程对象的名称 ;l“Series to forecast”中选择要预测的对象,在默认情况下,预测对象是概率值 ;l“Output”中可以选择输出形式 ;l“Series names”中显示的是生成的预测名称。 一、二元选择模型3.二元选择模型的分析二元选择模型的回归结果分析包括:二元选择模型的回归结果分析包括:产生残差序列产生残差序列
97、通过选择方程工具栏中的“Proc”|“Make Residual Series”选项可以生成三种残差,分别是普通残差(Ordinary)、标准化残差(Standardized)和一般化残差(Generalized)。 二、排序选择模型1.排序选择模型的类型常见的多元选择模型的类型主要有三种:(1)将供选择的对象按某种标准进行排序,然后从中进行选择。 (2)根据对可供选择对象的偏好程度进行分类。 (3)在多重选择中没有顺序,决策者可以从中任意进行挑选。 (1)、(2)属于排序选择问题。 排序是指,在多种选择项中,有一定的顺序或级别。与一般多元选择模型不同的是,排序选择问题需要建立排序选择模型(O
98、rdered Dependent Model)。二、排序选择模型1.排序选择模型的类型 在排序选择模型中,同样要设定一个指标变量yt,设变量yt有0,1,2,m供m+1个取值种类。 yt=1x1t +2x2t +kxkt+t (t=1,2,n)其中,t是独立同分布的随机变量,yt是可以用yt表示的,如下: 0, 当ytc1 1, 当c1 ytc2yt = 2, 当c2 ytc3 m,当cm 0时从上式可以看出,所有指标变量yt的负值都取0,称这些在0处进行了左截取,也被称为左审查(Left Censored)。因而此模型被称为规范的审查回归模型,也称为Tobit模型。 三、受限因变量模型1、审
99、查回归模型(Censored Regression Model) 有时,可以在任意有限点的左侧和右侧进行截取(审查),即 c t , 当yt c t 时yt = yt, 当c t yt0,r+1=0备择假设为 H r1:r+10, r=1,2,k1检验统计量为 其中, r是特征根迹统计量。四、Johansen协整检验2 2、JohansenJohansen协整检验协整检验(1)特征根迹(Trace)检验 当 0 临界值时,接受H10,至少有一个协整向量;当 1 临界值时,拒绝H10,至少有两个协整向量;当 r0, 检验统计量为 r = nln(1r+1) 其中, r是最大特征根统计量。当 0
100、临界值时,拒绝H00,至少有一个协整向量;当 1 临界值时,拒绝H10,至少有两个协整向量;当 rn时,超出样本的观测区间,是对未来状态的估计,将该种估计称为预测;第二类:当t=n时,与样本观测区间相同,是对现在状态的估计,将该种估计称为滤波;第三类:当tn时,是利用到现在为止的观测值对过去状态的估计,将该种估计称为平滑。二、卡尔滤波假定系统矩阵Z t,H t,T t, R t,Q t是已知的,初始状态向量 0的均值为a 0,误差协方差矩阵为P0并且是已知的。设a t1是基于信息集合Yt1的 t1的估计量,Pt1是估计误差的mm维协方差矩阵。当a t1和Pt1给定时, t的条件分布的均值为 a
101、 t | t1 = T t a t1 + c t (1)估计误差的协方差矩阵是P t | t1 = T t Pt1 T t + R tQ t R t (2)(1)和(2)为预测方程。 二、卡尔滤波当得到新的预测值xt时,就可以对 t的估计a t | t1进行修正,新方程为a t = a t | t1 +P t | t1 Z t F t1(x t Z t a t | t1 d t )P t= P t | t1 P t | t1 Z t F t1 Z t P t | t1 F t = Z t P t | t1 Z t + H t 卡尔滤波的初值可以按a 0和P 0或者a1 | 0和P1 | 0指定
102、,在每一个观测值下,卡尔滤波给出状态向量的最优估计。当所有的n个观测值都已处理完毕后,卡尔滤波会产生当前状态向量和下一个时期状态向量的最优估计。 三、状态空间模型的建立在对状态空间模型进行估计时,需先创建一个状态空间对象。在主菜单栏中选择“Object”|“New Object”|“SSpace”选项,即建立了一个状态空间对象,同时打开了一个空的状态空间说明窗口。三、状态空间模型的建立定义一个状态空间模型的方法有两种:(1)利用EViews软件中的自动指定功能设定状态空间模型的标准形式。选择状态空间对象工具栏中的“Proc”|“Define State Space”选项,得到下图所示的对话框。
103、在该对话框中可以对状态空间模型进行设定。三、状态空间模型的建立“Basic Regression”(基本回归)选项卡(基本回归)选项卡该选项卡中可以设定模型的基本回归部分。在“Dependent variables”中指定因变量;在“Regressors with fixed coefficients”中输入带有固定系数的回归变量;在“Regressors with recursive coefficients”中指定误差项的ARMA结构。三、状态空间模型的建立“Stochastic Regressors”(随机回归)选项卡(随机回归)选项卡 该选项卡中将带有随机系数的回归变量加入模型中 。在
104、“Constant mean(plus noise)coefficients”中输入的是固定均值系数;在“AR(1) coefficients”中输入AR(1)系数的形式;在“Random walk coefficients”中输入的是随机游走系数;在“Random walk(with drift)coefficients”中输入的是带有漂移的随机游走系数。三、状态空间模型的建立“Variance Specification”(方差说明)选项卡(方差说明)选项卡该选项卡中可以为量测方程或状态方程选择方程矩阵类型。包括四种类型: Identity”为单位矩阵,“Common Diagonal”为
105、共同对角矩阵,“Diagonal”为一般对角矩阵,“Unrestricted”为无限制矩阵。三、状态空间模型的建立(2)在下图所示的状态空间对象的文本编辑栏中也可以对状态空间模型进行定义。在该编辑栏中通过关键词和文本可以描述量测方程、状态方程、初始条件、误差结构和待估参数的初始值。三、状态空间模型的建立量测方程量测方程: 量测方程的关键词是“signal”,如果该关键词缺失,系统默认下会将该方程设定为量测方程。量测方程的因变量可以包含表达式,例如log(kg)=ss1 + c(1) + c(3)x + ss2y 其中,ss1和ss2是状态变量。量测方程的右侧不能包含量测变量的当期值和未来值,即
106、不能包含因变量表达式中的变量。 三、状态空间模型的建立状态方程状态方程: 状态方程的关键词是“state”。状态方程中不能使用表达式,不能包含量测方程的因变量以及因变量的超前和滞后变量,但可以包含外生变量和未知参数,以及它们的非线性形式。每一个状态方程必须是状态变量一期滞后的线性方程。状态变量的高期滞后需通过定义新的状态变量才可以实现。三、状态空间模型的建立误差与方差误差与方差: 指定误差项的方差是将一个误差项加到状态空间方程中的最简单的方法,误差项必须放置方程的后面。误差的关键词是“var”,其表达式是关键词“var”加上一个赋值语句。误差的表达式需用方括号括起。所指定的方差可以是已知常数,
107、也可以是未知参数的表达式。 命名误差方法包括两个部分,第一部分是用“ename”关键词,后面接等号和以方程中的残差序列命名的变量名;第二部分是用“evar”关键词,后面接误差方差或者误差项协方差的赋值语句。 四、状态空间模型的估计当状态空间模型被定义好后,就可以对其进行模型的估计。在EViews软件操作中,选择状态空间对象工具栏中的“Proc”|“Estimate”选项,得到对话框。在“Sample”中输入要估计的样本区间,系统默认下为整个样本区间;在“Optimization algorithm”(最优化算法)中选择估计算法,包括“Marquardt”(马夸特测定法)和“BHHH”估计方法;
108、在“Iteration Control”(循环控制)中可以设定最大循环次数和收敛值;在“Derivatives”(导数方法)中,有两种计算导数的方法,分别是“Accuracy”和“Speed”。如果选择“Accuracy”计算的精度会更高,如果选择“Speed”计算的速度会更快。五、状态空间模型的视图和过程1.状态空间模型的视图选择工具栏中的“View”|“Specification”选项,其包括五个子菜单。“Text screen”为文本视图,通过该视图可以完成对状态空间模型的定义或修改。用户选择工具栏中的“Spec”功能键,同样可以打开文本视图。 五、状态空间模型的视图和过程1.状态空间模
109、型的视图选择工具栏中的“View”|“Estimation Output”选项,可以通过图表方式显示量测方程的估计结果。选择工具栏中的“View”|“Actual,Predicted,Residual Graph”选项,可以通过图表方式显示量测方程的因变量的实际值、一步向前拟合值和一步向前标准化残差。选择工具栏中的“View”|“Coefficient Covariance Matrix”选项,可以显示估计的系数协方差矩阵。选择工具栏中的“View”|“Wald Coefficient Tests”选项,在弹出的图1311所示的对话框中输入检验系数的约束条件,如“c(1)=0.02”,然后单击
110、“OK”按钮,即可得到检验结果。 五、状态空间模型的视图和过程2.状态空间模型的过程通过状态空间对象工具栏中的“Proc”功能键可以完成对模型的创建、估计和预测等。其中,“Define State Space”和“Estimate”两项功能在状态空间模型被估计前和被估计后均可以使用。五、状态空间模型的视图和过程2.状态空间模型的过程如果状态空间模型已被正确的估计,则可以进行预测“Forecast”。选择工具栏中的“Proc”|“Forecast”选项将弹出对话框。在“Forecast method”中选择预测方法; 在“Forecast output”为预测结果输出,用户在四种输出形式中选择一
111、种,在右侧的编辑栏中指定序列名称;在“Initialize states with”中可以设置初始条件用户还可以使用“EViews computed”计算初始值。五、状态空间模型的视图和过程2.状态空间模型的过程通过工具栏中的“Proc”|“Make Signal Series”选项可以产生量测序列。 通过工具栏中的“Proc”|“Make Statel Series”选项可以产生状态序列。 本章小结: 了解状态空间模型的基本理论 掌握状态空间模型的建立方法 了解卡尔滤波方法 掌握状态空间模型的估计方法第14章 联立方程模型 重点内容: 联立方程的识别 联立方程的估计方法 联立方程的建立一、联
112、立方程模型概述1.联立方程模型联立方程系统的一般形式为f(yt ,zt ,)= t 其中,yt为内生变量向量,zt为外生变量向量,t是扰动向量,n是样本容量,是待估计的未知参数向量 一、联立方程模型概述1.联立方程模型例如:在开放经济条件下,一国国内生成总值(Y)、居民消费(C)、投资(I)和政府消费(G)和净出口(NX=XM)等经济变量共同组成了一个宏观经济系统。假定政府消费G和出口X是给定的,则他们之间的关系为:Ct = 0 + 1Yt + 1tIt = 0 + 1Yt + 2Yt1 +2t Mt = m0 + m1Yt + 3tYt = Ct + It + Gt +(XMt) 一、联立方
113、程模型概述2.联立方程模型基本概念(1)变量内生变量内生变量:在联立方程模型中,内生变量由系统决定,同时又对系统产生影响,是具有某种概率分布的随机变量,一般都是经济变量。联立方程中的因变量均是内生变量。外生变量外生变量:外生变量是由联立方程系统外决定的变量,其影响整个系统但本身不受系统的影响。外生变量一般是经济变量、政策变量、条件变量和虚拟变量。先决变量先决变量:外生变量和滞后内生变量统称为先决变量。滞后内生变量可以反映出经济系统的动态变化,是联立方程中重要的变量。 一、联立方程模型概述2.联立方程模型基本概念(2)结构式联立方程模型 结构式联立方程模型是指根据经济理论和行为规律建立的描述经济
114、变量间直接关系结构的方程系统。在结构方程中,方程左侧是内生变量,方程右侧为先决变量,也可以包括其他内生变量。结构方程中的系数被称为结构系数。其基本形式可以写为:BY + X = u 一、联立方程模型概述2.联立方程模型基本概念(3)简化式联立方程模型简化式联立方程模型是指将联立方程中的每一个内生变量表示成所有先决变量和随机误差项的函数的系统,即将所有的先决变量作为每个内生变量的解释变量。简化式联立方程模型不反映系统中经济变量的直接关系,因而不是经济系统的客观描述。由于简化式模型中作为解释变量的变量中没有内生变量,因而可以用普通最小二乘法(OLS)估计每个方程的系数,所以它对联立方程模型的研究具
115、有重要意义。 二、联立方程模型的识别1.结构式方程识别条件假设联立方程模型的结构式中第i个方程中包括ki个内生变量和gi个先决变量,矩阵(B0, 0)表示第i个方程中未包含的变量在其他k1个方程中对应系数所构成的矩阵。于是判断第i个方程识别状态的结构式识别条件为: 如果rank(B0, 0)ki 1,则第i个结构方程过度识别。rank(B0, 0)表示系数的矩阵。二、联立方程模型的识别2.简化式方程识别条件在联立方程模型的简化式1411中,简化式的识别条件为 如果rank(2)ki 1,则第i个结构方程过度识别。三、联立方程模型的估计方法1.三阶段最小二乘估计法 三阶段最小二乘法的基本思想是,
116、先用两阶段最小二乘法估计每一个方程,然后再用广义最小二乘法对整个联立方程系统进行估计。首先是估计联立方程模型的简化形式,然后用全部内生变量的拟合值得到联立方程模型中所有方程的两阶段最小二乘估计。再用所得到的每个方程的残差值估计方程间的方差和协方差。最后用广义最小二乘法得到系数的估计值。 三、联立方程模型的估计方法2.完全信息极大似然估计法 完全信息极大似然法是极大似然估计法的一个推广,是基于联立方程模型的系统估计法。 完全信息极大似然法能根据已知样本观测值使得整个联立方程模型的似然函数达到最大,从而得到所有结构参数的估计量。当同期误差项具有一个联合正态分布时,FIML方法得到所有参数估计量的有
117、效值。对极大似然函数求解,可得到结构系数的FILM估计量。 四、联立方程系统的建立 在EViews软件中,要估计系统参数需先建立系统对象。在主菜单栏中选择“Object”|“New Object”|“System”选项,将弹出一个系统对象空白窗口。在该窗口中需对系统方程进行设定。 在空白文本编辑栏中输入系统方程。系统方程中的方程应该是含有未知系数和残差的行为方程,应用EViews的标准表达式进行书写。例如cons = c(1) +c(2) * gdp +c(3) cons(1) + c(4) nxinv = c(5) + c(6) gdp + c(7) gov 四、联立方程系统的建立 方程中的
118、变量和系数可以是非线性的。在不同的方程中使用相同的系数可以对方程间的系数进行约束。例如,y = c(1) + c(2) * xz = c(3) + c(2) * x + c(4) * y也可以加入附加约束,例如y = c(1) *x1 + c(2) * x2 + c(3) * x3如果附加约束条件为:c(1) + c(2) + c(3) =1则可将该方程写为y = c(1) *x1 + c(2) * x2 + 1 c(1) c(2) * x3四、联立方程系统的建立系统中的方程应该是行为方程,即应有一个公式外的内生扰动项,如果方程中没有扰动项,那该方程就是一个恒等式,恒等式是不包含在系统方程中的
119、。如果每个方程只描述总体的一部分,所有方程的和就是一个恒等式,所有扰动项的和为0。此时,应该去掉一个方程,以免出现不可识别的问题。四、联立方程系统的建立使用三阶段最小二乘法对系统进行估计时必须设定估计中所使用的工具变量。通常设定工具变量的方法有两种:一种是以关键词“inst”或“inst”开头,后面接工具变量的名称;一种是在方程的末尾加符号“”,后面加工具变量。如果每个方程所使用的工具变量相同,就使用第一种方法设定工具变量;如果每个方程的工具变量是不同的,则使用第二种方法设定工具变量。 四、联立方程系统的建立系统设定好后,可对其进行估计。单击系统对象工具栏中的“Estimate”功能键,在弹出
120、如图所示的“Estimation Method”选项卡对话框的“Method”中选择估计方法。 四、联立方程系统的建立当选择“Iteration Options”选项卡时会弹出如图所示的对话框,系统默认项是“Update weights once then”中的“Iterate coefs to convergence”。 四、联立方程系统的建立当选择“Iteration Options”选项卡时会弹出如图所示的对话框,系统默认项是“Update weights once then”中的“Iterate coefs to convergence”。 四、联立方程系统的建立如果选择“Update
121、 coefs once”选项,首先进行第一阶段的估计,然后完成加权矩阵的估计。在第二阶段中,不再迭代到系数收敛,只进行简单系数一步迭代过程。如果选择“Iterate weights and coefs”中的“Simultaneous updating”选项,则每次迭代都会更新系数和加权矩阵,然后重复进行这样的迭代直到系数和加权矩阵都收敛为止。如果选择“Iterate weights and coefs”中的“Sequential updating”选项,将重复执行更新权重的默认方法,直到系数和加权矩阵都收敛为止。五、联立方程模型的模拟 首先需创建一个模型对象,用户可以选择主菜单栏中的“Obje
122、ct”|“New Object”|“Model”选项,创建一个空白模型,然 后 输 入 系 统 方 程 。 或 者 选 择 系 统 对 象 窗 口 中 的“Proc”|“Make Model”选项,即可得到包含系统对象中的方程的模型对象。 模型中的方程可以是内置的,也可以是链接的。内置方程以文本形式显示在模型对象中,链接方程在模型中的表达式来源与模型以外的对象。向模型中添加方程的方法有两种:一种是添加链接方程,一种是添加文本形式的方程。五、联立方程模型的模拟添加链接方程添加链接方程:如果是通过主菜单栏中的“Object”|“New Object”|“Model”选项建立的模型对象,则在工作文件
123、中选中要放入模型中的方程对象,然后单击鼠标右键,在弹出的菜单中选择“Copy”(复制),再打开模型对象,在该窗口中单击鼠标右键,选择弹出菜单中的“Paste”(粘帖),即可将方程对象放入模型中。如果在系统对象窗口中建立的模型对象,则会自动生成一个包含该方程组的模型。五、联立方程模型的模拟添加文本形式的方程添加文本形式的方程:在模型对象窗口单击鼠标右键,在弹出的菜单中选择“Insert.”选项,将弹出一个窗口,在空白文本框中输入想要链接的方程对象的名称即可。通常可在名称前加上冒号,例如“:eq01”,这样就将工作文件中的方程对象eq01和系统对象sys01放入模型中。五、联立方程模型的模拟删除模
124、型中的方程删除模型中的方程:如果要删除模型中的方程,需选中模型窗口中的方程对象,然后单击鼠标右键,在弹出的菜单中选择“Delete”即可完成操作。这里需要说明的是,在模型中添加和删除方程对象会改变模型的内生变量。 五、联立方程模型的模拟更新模型中的方程更新模型中的方程:如果要更新模型中的链接方程,需选择模型对象窗口工具栏中的“Proc”|“Links” |“Update All Links Recompile model”选项,即可完成更新。 五、联立方程模型的模拟查看模型中的方程查看模型中的方程:如果需要以文本形式查看方程,需选择模型对象窗口工具栏中 的 “Proc”|“Links” |“B
125、reak All Links Make all equations inlines”选项,即可将模型中的所有方程转化为内置文本形式。六、联立方程模型求解当模型被建立好后,就可以对其进行求解。打开模型对象窗口,在其工具栏中选择“Solve”功能键,将弹出如图所示的对话框。六、联立方程模型求解在“Stochastic Options”选项卡中可以对随机模拟 进行设置。在“Repetitions”的“Successes”的文本框中可以设定随机模拟迭代过程的次数,系统默认为迭代1000次。 在“Confidence interval”进行置信区间的设定。在“Innovation covariance”
126、中可以对随机方程扰动项的产生方式进行设定。 六、联立方程模型求解在“Estimation sample”中可以设定估计模型残差的方差和协方差矩阵所使用的样本区间。 “Include coefficient uncertainty”复选框用于确定链接方程中所估计的参数在随机拟合中是否应该随机变化。如果选中该复选框,则每次迭代开始时都将会随机地重新抽取系数。在“Solver”选项卡中可以设定与模型所采用的非线性方程有关的求解方法。 本章小结: 了解联立方程模型的基本形式 了解联立方程模型的识别 掌握联立方程模型的估计方法 掌握联立方程模型的建立方法 掌握联立方程模型的模拟和求解第15章 EView
127、s程序设计 重点内容: EViews基本命令操作 程序变量的使用 EViews控制程序语句的使用一、EViews命令基础1.工作文件命令创建工作文件的命令为workfile name frequency start end其中,“workfile”为“工作文件”,“name”为该工作文件的名称,“frequency”为设定的频率,“start”和“end”为日期的开始和结束时间。在起止时间的设定中,用“a”表示年份数据,“s”表示半年数据,“q”表示季度数据,“m”表示月度数据,“w”表示周数据,“d”表示日数据(每周五天,周一至周五),“7”表示日数据(每周七天,周一至周日),“u”表示非时
128、序数据。一、EViews命令基础1.工作文件命令例如,建立一个2000年至2009年的年度数据工作文件“w”,其命令为workfile w a 2000 20009命令操作中每一项之间用空格隔开,如“workfile”与“w”之间空一格。命令输入好后,按“Enter”(回车)键即可创建一个工作文件。 当要改变工作文件的起止时间时,需用“expand”或“range”命令。例如,将上面建立的工作文件起止时间更改为1998年至2008年。其操作命令为expand 1998 2008 或者 range 1998 2008。一、EViews命令基础1.工作文件命令保存工作文件的命令为save 保存路径
129、保存的文件名例如,save d:backup我的文档w打开已经建立好的工作文件命令为load 文件保存的路径文件名例如,load d:backup我的文档w关闭已存在的工作文件的命令为close 文件名例如 close w 一、EViews命令基础2.对象命令建立对象的命令为对象类别 对象名称例如:建立一个方程对象,命名为eq01,则操作命令为equation eq01对象操作的命令主要有:do freeze print show四个: “do”用来执行命令但不打开窗口, “freeze”用来生成表格, “print”用来打印处于激活状态的对象, “show”用来显示对象窗口。一、EViews
130、命令基础3.模型基础命令单方程模型的命令:单方程模型的命令:建立方程对象的命令为equation 方程对象的名称方程对象的名称.ls 方程表达式中的因变量和自变量打开方程对象的命令为方程对象的名称.results显示估计系数的方差协方差矩阵的命令为方程对象的名称.coefcov一、EViews命令基础3.模型基础命令单方程模型的命令:单方程模型的命令:如果用加权最小二乘法对模型进行估计时,需要指定权重序列,这里用“w=权重序列名称”表示,例如equation eq01.ls(w=w01) y c x1 x2 x3则该方程的估计方法是加权最小二乘法,权重序列是w01。“h”为怀特(White)异
131、方差方法的应用,例如equation eq01.ls(h) y c x1 x2 x3一、EViews命令基础3.模型基础命令联立方程系统的命令:联立方程系统的命令:联立方程中系统对象的建立命令为system 系统对象的名称例如,system ss01即可建立一个名称为ss01的系统对象,并且同时打开该系统对象窗口。用户在该窗口可以进行系统对象的相关操作。 一、EViews命令基础3.模型基础命令联立方程模型的命令:联立方程模型的命令:建立模型对象的命令为model 模型对象的名称此时建立的是一个空的模型对象,里面不包含任何方程对象和系统对象。建立包含已估计的联立方程系统对象的模型,该模型可以用
132、来预测和模拟,其操作命令为系统对象的名称.makemodel二、程序变量1.控制变量在EViews程序中用来代替数据的变量被称为控制变量。控制变量被赋值后,可以在程序中任意使用该数据的地方使用该控制变量。控制变量的定义格式为“!变量名”,即在变量名前加叹号,例如“!y”。变量名不能多于15个字符。当对控制变量赋值时,使用等号“=”。等号左边为控制变量名称,右边为赋值表达式,例如!y=12控制变量的值被存储在程序执行的过程中,并随着程序的结束而自动终止。当一个工作文件被保存时,控制变量不能随之被保存,但可以建立一个包含控制变量值的对象来存储控制变量。二、程序变量2.字符串变量字符串是一段文本,用
133、双引号进行引用。例如“gross domestic product”“ar(1) ar(2) ma(1) ma(2)”字符串变量的值是字符串,变量名前使用“%”作为标记。使用等号进行赋值,等号左侧为字符串变量的名称,等号右侧为字符串表达式。例如%gdp=“gross domestic product”%armas= “ar(1) ar(2) ma(1) ma(2)”%dep=“sh”%sample01=“2000 2009”二、程序变量2.字符串变量EViews中有几个常用字符串函数,例如:left为返回字符串左侧开始给定个数的字符,right为返回字符串右侧开始给定个数的字符,mid为返回字
134、符串指定起点开始向右给定个数的字符。 二、程序变量2.字符串变量函数val为将字符型变量转化为数值型变量。%ss=“10.65”!tt=val(%ss)即创建一个控制变量!tt=10.65。当字符串变量的首字符非数值型字符时,val将返回空值,从第一个不是0的字符到最后所有的字符均将被忽略。例如,data=“06/22/2009”scalar day=val(mid(%data,4,2)scalar year=val(data)则得到的标量对象day=22,month=6。 二、程序变量2.字符串变量函数str为将数值型变量转化为字符型变量。例如,!y=407str(!y)即返回字符串407。
135、函数otod(Obs To Date)为返回一个表示日期的字符串,这个日期是工作文件中的指定的日期。例如,creat 1 50:1 90:4!y=16%data=otod(!y)返回的字符串为:%data=“1953:4”。函数dtoo(Date To Obs)为返回一个标量,返回指定工作文件中的日期。二、程序变量3.置换变量置换变量就是可以通过改变字符串变量的取值来代替它在命令中的实际内容的变量。例如字符串变量%x为%x=“m”ls %x c %x(1) 相当于 ls m c m (1)这里的%x即为置换变量。当置换变量与其他字母、数字或变量合用时,应用大括号来确定置换变量的界限。 二、程序
136、变量4.程序中的形式参数程序中的形式参数是一种特殊的字符串变量。程序参数允许每次运行程序时改变字符串变量的参数值,从而使得程序具有较强的通用性。可将程序参数命名为%1,%2,%3等等。当运行的程序含有参数时,必须给出参数的具体值。例如,建立一个程序名为PR01的程序:equation eq01smpl 1999:1 2009:6eq01.ls %1 c %2 %2(1) time二、程序变量4.程序中的形式参数用命令来执行该程序,使得%1=“m”,%2=“ex”,则应输入的命令为run pr01 m ex程序通过执行命令“eq01.ls %1 c %2 %2(1) time”对应变量m和自变量
137、c、ex、ex(1)和time做回归。二、程序变量4.程序中的形式参数如果使用“Run”功能键或者选择“File”|“Run”选项,会得到如图所示的对话框,在中间文本编辑框中可以输入参数值。如果使用Run命令,则应在程序名后面列出参数值。 二、程序变量4.程序中的形式参数在“Program name or path”输入程序的名称或路径,本例为“PR01”在“Program arguments”输入参数值,本例为“m ex”。在Run命令或运行程序对话框中没有被赋值的参数时,则被认为是空。例如,假设有如下程序pr001:ls m c ex time %1 %2 如果命令为“run pr001
138、ex(1) m(1)”,则执行的命令为:ls m c ex time ex(1) m(1)如果命令为“run pr001”,则执行的命令为:ls m c ex time这样在“ls m c ex time %1 %2”中所包含的参数就被忽略了。三、EViews控制程序语句1.IF条件语句EViews软件用IF/ENDIF语句来表达命令的执行。IF条件语句以if关键词开始,后面为条件表达式,然后为then关键词。在条件中可以使用and或or,如果需要还可以用括号将条件括起来。如果表达式为真,endif前所有的命令都被执行;如果表达式为假,所有的命令都被跳过。例如,if !t4 and !t12
139、then Smpl 2001 20007+!t endif该命令为当控制变量!t取值在4和12之间时,生成新的样本区间2001 2007+!t。三、EViews控制程序语句2. FOR循环语句用FOR循环语句可对不同的控制变量和字符串变量重复执行一组命令。FOR循环语句以for关键词开始,以next关键词结束。(1)带有控制变量的FOR循环要给控制变量赋予不同的值,FOR循环先给一个控制变量赋予初值,然后接to关键词,最后是终值。在终值后可以接step关键词,step后面是循环变量每次循环的步长。如果省略step,则默认值为1。 三、EViews控制程序语句2. FOR循环语句for !h=1
140、 to 20 series decile!h=(m=tt!h)next本例中,变量!h两次被用作置换变量,第一次产生decile1到decile10十个序列,第二次产生tt1到tt10十个变量。步长为1 。在使用FOR循环语句时,可以改变样本期,例如,for !month=1 to 12 smpl 2000:1 2001:+!monthequation eq!month.ls m c exnext三、EViews控制程序语句2. FOR循环语句FOR循环语句也可以进行嵌套,例如,matrix(25,10) mafor !h=1 to 25for !j=1 to 10 ma(!h,!j)=(!h
141、1)*10+!j nextnext本例中,产生一个25行10列的矩阵,并将其命名为“ma”,并对第!h行第!j列元素赋值。三、EViews控制程序语句2. FOR循环语句(2)带有字符串变量的FOR循环对字符串变量进行重复赋值时,需在字符串变量名称后面列出需取值的变量,例如,for %z m n r x equation %ztrend.ls %z c %z(1) timenext在该程序中,估计了名为mtrend、ntrend、rtrend、xtrend四个方程。 三、EViews控制程序语句2. FOR循环语句(2)带有字符串变量的FOR循环当在一个FOR循环中使用多个字符串变量时,EVi
142、ews会自动对这些字符串进行分组。但需注意的是,后面的取值一定与字符串变量相对应。例如,for %1 %2 %3 1994:1 1996:4 early 1998:2 2000:3 mid 2002.:4 2007:2 late smpl %1 %2 equation %3eq.ls m c exnext三、EViews控制程序语句3. WHILE循环语句 WHILE循环语句是只满足特定条件才执行循环的命令。 WHILE循环以while关键词开始,以wend关键词结束,中间可以有多个命令,也可以使用嵌套。 while关键词后接表达式,该表达式可以有逻辑值(真/假)和数值两种情况。当取值为数字时
143、,0代表假,其他非0数值代表真。如果表达式为真,则循环执行wend以前的命令;如果表达式为假,执行wend后的命令。 三、EViews控制程序语句3. WHILE循环语句与FOR循环不同的是,WHILE循环不在测试条件中改变控制变量的值,如果需要改变控制变量的值,需在循环中明确声明,否则循环将继续下去。用F1键可以使程序跳出死循环。四、子程序程序是一个命令的集合,用一个程序中的子程序可以处理另一个程序中的相同问题。子程序以“subroutine”开始,后接函数名和参数,以endsub结束。例如,subroutine sqs series y=x3endsub本例中,子程序的运行结果是,形成序列
144、x的三次方,并将其保存在序列y中。四、子程序有以下几点需要特别注意:(1)如果subroutine中有多个变量,则用括号将变量括起,但需表明变量所属的对象类型。(2)如果subroutine是作为一个单独的子程序保存时,那么在调用时需用include命令。(3)如果要执行subroutine需要用call命令。(4)subroutine与endsub之间不能重复出现subroutine和endsub。子程序中间要执行其他子程序时,可用call命令来实现。(5)用return命令退出subroutine。本章小结: 了解EViews软件的程序设计 掌握基本命令的操作 掌握编程中使用的程序变量和控制语句