从系数中可以看出边际消费倾向(qīngxiàng)是0.73也即1978年~2006年中国居民可支配收入的73%用来消费第12页/共88页第十二页,共89页13 2. 标准差 (Std.Error) 标准差项报告了系数估计的标准差标准差衡量了系数估计的统计(tǒngjì)可信性----标准差越大,估计中的统计(tǒngjì)干扰越大 估计系数的协方差矩阵是由以下公式计算得到的:这里 是残差而且系数估计值的标准差是这个矩阵对角线元素的平方根可以通过(tōngguò)选择View/Covariance Matrix项来察看整个协方差矩阵 其中(qízhōng)第13页/共88页第十三页,共89页14 3. t-统计量 t统计量是由系数估计值和标准差之间的比率来计算的,它是用来检验系数为零的假设的 4. 概率(P值) 结果的最后一项是在误差项为正态分布或系数估计值为渐近正态分布的假设下, 指出 t 统计量与实际观测值一致(yīzhì)的概率 这个概率称为边际显著性水平或 P 值给定一个 P 值,可以一眼就看出是拒绝还是接受实际系数为零的双边假设。
例如,如果显著水平为5% ,P 值小于0.05就可以拒绝系数为零的原假设 对于例1的结果,系数 inc 的零假设在1%的显著水平下被拒绝第14页/共88页第十四页,共89页15 §3.4.2 方程(fāngchéng)统计量 1. R2 统计量 R2 统计量衡量在样本内预测因变量值的回归是否成功R2 是自变量所解释的因变量的方差如果回归完全符合,统计值会等于1如果结果不比因变量的均值好,统计值会等于0R2 可能会由于一些原因成为负值例如(lìrú),回归没有截距或常数,或回归包含系数约束,或估计方法采用二阶段最小二乘法或ARCH方法 EViews计算R2 的公式为: ,其中(qízhōng), 是残差, 是因变量的均值 第15页/共88页第十五页,共89页16 2. R2 调整 使用R2 作为衡量(héng liáng)工具存在的一个问题,即在增加新的自变量时R2 不会减少在极端的情况下,如果把样本观测值都作为自变量,总能得到R2 为1。
R2 调整后的记为 ,消除R2 中对模型没有解释力的新增变量计算方法如下: 从不会(bù huì)大于R2 ,随着增加变量会减小,而且对于很不适合的模型还可能是负值 第16页/共88页第十六页,共89页17 3. 回归(huíguī)标准差 (S.E. of regression) 回归(huíguī)标准差是在残差的方差的估计值基础之上的一个总结计算方法如下: 4.残差平方和 残差平方和可以用于很多统计计算中,为了(wèi le)方便,现在将它单独列出: 第17页/共88页第十七页,共89页18 5. 对数似然函数值 EViews可以作出根据系数(xìshù)的估计值得到的对数似然函数值(假设误差为正态分布)似然比检验可通过观察方程严格形式和不严格形式的对数似然值之间的差异来进行 对数似然计算如下: 第18页/共88页第十八页,共89页19 6. Durbin-Watson 统计量 D-W 统计量衡量(héng liáng)残差的一阶序列相关性,计算方法如下: 作为一个规则,如果DW值小于2,证明存在正序列相关。
在例1的结果中,DW值很小,表明残差中存在序列相关关于Durbin-Watson统计量和残差序列相关更详细的内容参见“序列相关理论(lǐlùn)” 对于序列相关还有更好的检验方法在 “序列相关的检验”中,我们讨论Q统计量和 LM检验,这些都是比DW统计量更为一般的序列相关检验方法 第19页/共88页第十九页,共89页20 7. 因变量均值和标准(biāozhǔn)差(S.D) y 的均值和标准(biāozhǔn)差由下面标准(biāozhǔn)公式算出: 8. AIC准则(zhǔnzé)(Akaike Information Criterion) 计算公式如下: 其中(qízhōng)l 是对数似然值 我们进行模型选择时,AIC值越小越好例如,可以通过选择最小AIC值来确定一个滞后分布的长度第20页/共88页第二十页,共89页21 9. Schwarz准则(zhǔnzé) Schwarz准则(zhǔnzé)是AIC准则(zhǔnzé)的替代方法: 10. F统计量和边际(biānjì)显著性水平 F统计量检验回归中所有的系数是否为零(除了常数或截距)。
对于普通最小二乘模型,F统计量由下式计算: 在原假设为误差正态分布下,统计(tǒngjì)量服从 F(k – 1 , T – k) 分布 第21页/共88页第二十一页,共89页22 F统计量下的P值,即Prob(F-statistic), 是F检验的边际(biānjì)显著性水平如果P值小于所检验的边际(biānjì)显著水平,比如说0.05,则拒绝所有系数都为零的原假设对于例1,P值为零,因此,我们拒绝回归系数为零的原假设注意F检验是一个联合检验,即使所有的t统计量都是不显著的,F统计量也可能是高度显著的 第22页/共88页第二十二页,共89页23§3.5 §3.5 方程方程(fāngchéng)(fāngchéng)操作操作 3.5.1 方程视图 以三种形式显示方程:EViews命令形式,带系数符号(fúhào)的代数方程,和有系数估计值的方程 可以将这些结果(jiē guǒ)剪切和粘贴到支持Windows剪贴板的应用文档中 第23页/共88页第二十三页,共89页24 · Estimation Output显示方程结果 · Actual, Fitted, Residual以图表(túbiǎo)和数字的形式显示因变量的实际值和拟合值及残差。
· Actual, Fitted, Residual Table 以表的形式来显示这些值第24页/共88页第二十四页,共89页25 · Gradients and Derivatives...描述目标函数的梯度和回归函数的导数计算的信息详细内容参见附录E, “梯度和导数” · Covariance Matrix以表的形式显示系数估计值的协方差矩阵要以矩阵对象保存协方差矩阵,可以使用@cov函数 · Coefficient Tests, Residual Tests, and Stability Tests 这些是 “定义和诊断(zhěnduàn)检验”中要详细介绍的内容 第25页/共88页第二十五页,共89页26 3.5.2 3.5.2 方程方程(fāngchéng)(fāngchéng)过程过程 · Specify/Estimate... 编辑方程说明、改变估计方法、估计样本 · Forecast ... 用估计方程的预测 · Make Model 创建一个与被估计方程有关的未命名模型。
· Update Coefs from Equation 把方程系数的估计值放在系数向量中 · Make Regressor Group 创建包含方程中使用的所有变量的未命名组(常数(chángshù)除外) · Made Residual Series... 以序列形式保存回归中的残差 · Make Derivative Group 创建包含回归函数关于其系数的导数的组 · Made Gradient Group 创建包含目标函数关于模型的系数的斜率的组 第26页/共88页第二十六页,共89页271. 1. 回归方程的函数回归方程的函数(hánshù)(hánshù)形式形式 下面讨论几种形式的回归模型: (1) 双对数线性模型(不变弹性模型) (2)半对数模型 (3)双曲函数模型 (4)多项式回归模型 所有(suǒyǒu)这些模型的一个重要特征是:它们都是参数线性模型,但是变量却不一定是线性的 (1) (1) 双对数线性方程双对数线性方程 双双对对数数线线性性模模型型估估计计得得到到的的参参数数本本身身就就是是该该变变量量的的弹弹性性(tánxìng)(tánxìng)。
如如设设Qt Qt 为产值,为产值,Pt Pt 为价格,在为价格,在 log(Qt)= log(Qt)= + + log(Pt) + ut log(Pt) + ut的的估估计计式式中中,,P P 增增加加1%1%时时,,Q Q 大大约约增增加加β%β%,,所所以以β β相相当当于于QtQt的的价价格格弹弹性性(tánxìng)(tánxìng)§ §3.63.6 线性回归方程的应用实例线性回归方程的应用实例 第27页/共88页第二十七页,共89页28 [推导] 当 t+1期的P 比上一期增加1%时,有 log(Qt+1) = +βlog(Pt·1.01)) = +βlog(Pt)+βlog(1.01)) = log(Qt) +βlog(1.01) 移项得, log(Qt+1) − log(Qt) = βlog(1.01)),即 ,还原(huán yuán)得 因此,P 变化1%时,Q 大约变化β%。
例例3.3: 3.3: 下面建立我国居民消费的收入弹性下面建立我国居民消费的收入弹性(tánxìng)(tánxìng)方程:方程: log(cspt) = 0.25 + 0.908log(inct) log(cspt) = 0.25 + 0.908log(inct) t =(1.66) (55.05) t =(1.66) (55.05) R2 = 0.99 D.W. = 0.45 R2 = 0.99 D.W. = 0.45其中其中cspt cspt 是城镇居民消费,是城镇居民消费,inct inct 是居民消费可支配收入是居民消费可支配收入第28页/共88页第二十八页,共89页29 方程中消费的收入弹性为0.93,说明我国居民可支配收入每增加(zēngjiā)1%,将使得居民消费增加(zēngjiā)0.93%。
第29页/共88页第二十九页,共89页30 (2) (2) 半对数模型半对数模型 线性模型与对数线性模型的混合就是半对数模型线性模型与对数线性模型的混合就是半对数模型或或 半对数模型包含两种形式,分别为:半对数模型包含两种形式,分别为:((3.2.103.2.10)) ((3.2.113.2.11)) 半对数模型也是线性模型,因为参数是以线性形式出现在模型中的而半对数模型也是线性模型,因为参数是以线性形式出现在模型中的而且,虽然原来的变量且,虽然原来的变量 x x 和和 y y 之间是非线性关系,但变量之间是非线性关系,但变量 x x(或(或 y y)经过对数变)经过对数变换后,变量换后,变量ln(x) ln(x) 和和 y y 之间(或变量之间(或变量 x x 和和ln(y) ln(y) 之间)是线性关系,因此可以称之间)是线性关系,因此可以称其为半对数线性模型。
类似其为半对数线性模型类似(lèi sì)(lèi sì)双对数模型,半对数模型也可以使用双对数模型,半对数模型也可以使用OLSOLS估估计 第30页/共88页第三十页,共89页31 半对数(duì shù)模型(3.2.10)和(3.2.11)中的回归系数具有直观的意义:, (3.2.12)即:1表示 x 变化1%导致 y 绝对量的变化量;1表示 x 的变化1单位导致 y 变化的百分比特别地,如果在半对数(duì shù)模型式(3.2.11)中 x 取为 t(年份),变量 t 按时间顺序依次取值为1,2,…,T,则 t 的系数度量了 y 的年均增长速度,因此,半对数(duì shù)模型(3.2.11)又称为增长模型对于增长模型,如果1为正,则 y 有随时间向上增长的趋势;如果1 为负,则 y 有随时间向下变动的趋势,因此 t 可称为趋势变量宏观经济模型表达式中常有时间趋势,在研究经济长期增长或确定性趋势成分时,常常将产出取对数(duì shù),然后用时间 t 作解释变量建立回归方程。
第31页/共88页第三十一页,共89页32 例例3.4: 3.4: 我们建立半对数线性方程,估计我国实际我们建立半对数线性方程,估计我国实际GDPGDP(支出法,样本区间:(支出法,样本区间:19781978~~20022002年)的长期平均增长率,模型形式为年)的长期平均增长率,模型形式为其中:其中:GDPGDPPt Pt 表示剔出价格因素的实际表示剔出价格因素的实际GDPt GDPt 方程中时间趋势变量的系数方程中时间趋势变量的系数估计值是估计值是0.0940.094,说明,说明19781978~~20022002年我国实际年我国实际GDP GDP 的年平均增长率为的年平均增长率为9.4%9.4%F F值或值或R2R2表明模型拟合效果很好,表明模型拟合效果很好,D.W.D.W.显示模型存在显示模型存在(cúnzài)(cúnzài)(正的)自相关正的)自相关第32页/共88页第三十二页,共89页33 (3) (3) 双曲函数模型双曲函数模型 形如下式的模型称为双曲函数模型形如下式的模型称为双曲函数模型 这是一个变量之间是非线性的模型,因为这是一个变量之间是非线性的模型,因为Xt Xt 是以倒数的形式进入模型的,但这个是以倒数的形式进入模型的,但这个模型却是参数模型却是参数(cānshù)(cānshù)线性模型,因为模型中参数线性模型,因为模型中参数(cānshù)(cānshù)之间是线性的。
这个模型的之间是线性的这个模型的显著特征是随着显著特征是随着Xt Xt 的无限增大,(的无限增大,(1/Xt 1/Xt )接近于零接近于零 第33页/共88页第三十三页,共89页34 例例3.5 3.5 美国美国(měi ɡuó)(měi ɡuó)菲利普斯曲线菲利普斯曲线 利用美国利用美国(měi ɡuó)1955(měi ɡuó)1955~~19841984年的数据(附录年的数据(附录E.2E.2),根据菲利普斯曲线,即通货),根据菲利普斯曲线,即通货膨胀率膨胀率 t t 和失业率和失业率 Ut Ut 的反向关系,建立双曲函数:的反向关系,建立双曲函数: 估计结果表明,菲利普斯曲线所描述的 t 和Ut 的反向关系并不存在之所以出现这样的背离(bèilí),主要是因为20世纪70年代出现石油危机,从而引发了“滞胀”,通货膨胀伴随着高失业率如果考虑到通货膨胀预期的影响,则可以在模型中引入代表通货膨胀预期的变量,比如用通货膨胀前期值来代表 第34页/共88页第三十四页,共89页35含有通货膨胀预期的菲利普斯曲线(qūxiàn)估计结果为 可以看出,加入通货膨胀预期(yùqī)因素后,模型的拟合效果很好,而且这时的模型体现出了失业率和通货膨胀率之间的显著的反向变动关系。
第35页/共88页第三十五页,共89页36 2. 2. 虚拟变量的应用虚拟变量的应用 例例3.63.6:工资:工资(gōngzī)(gōngzī)差别差别 为了解工作妇女是否受到了歧视,可以用美国统计局的为了解工作妇女是否受到了歧视,可以用美国统计局的“ “当前人口调查当前人口调查” ”中的截面数据研究男女工资中的截面数据研究男女工资(gōngzī)(gōngzī)有没有差别这项多元回归分析研究所用到的变量有:有没有差别这项多元回归分析研究所用到的变量有: W — W — 雇员的工资雇员的工资(gōngzī)(gōngzī)(美元(美元/ /小时)小时) 1 1;若雇员为妇女;若雇员为妇女 SEX = SEX = 0 0;男性;男性 ED — ED — 受教育的年数受教育的年数 AGE — AGE — 雇员的年龄雇员的年龄 1 1;若雇员不是西班牙裔也不是白人;若雇员不是西班牙裔也不是白人 NONWH = NONWH = 0 0;其他;其他 1 1;若雇员是西班牙裔;若雇员是西班牙裔 HISP = HISP = 0 0;其他;其他第36页/共88页第三十六页,共89页。
37 对206名雇员(gùyuán)的样本所进行的研究得到的回归结果为(括号内是t统计量的值): (22.10)(-3.86) R2 = 0.068 D.W.=1.79 反映雇员(gùyuán)性别的虚拟变量SEX在显著性水平 1%下显著因为工资的总平均是9.60美元,该虚拟变量告诉我们,妇女的平均工资为8.12美元,或比总平均低1.48美元第37页/共88页第三十七页,共89页38 在回归模型中加入年龄AGE和受教育年数ED以及种族或民族(mínzú),性别虚拟变量仍然是显著的:(-3.38) (-4.61) (8.54) (4.63) (-1.07) (0.22) R2=0.367 D.W.=1.78 第38页/共88页第三十八页,共89页。
39 最后考虑年龄AGE与工资(gōngzī)W之间非线性关系的可能性时,男女差别还是显著存在的这一点可以由下列回归结果看出: (-4.59) (-4.50) (7.98) (-1.22) (0.28) (3.87) (-3.18) R2=0.398 D.W.=1.75 这个回归模型的年龄AGE项说明,在其他条件不变的情况下,雇员的工资率随着他的年龄的增长而增长(系数为0.62),但是增加的速度越来越慢(-0.0063)进一步的研究(yánjiū)表明,工资在雇员的年龄为49.2岁时达到最大,之后逐年下降 第39页/共88页第三十九页,共89页40 例例3.7 3.7 季节虚拟变量季节虚拟变量 当使用含有季节因素的经济当使用含有季节因素的经济(jīngjì)(jīngjì)数据进行回归分析时,可以对数据进行季节调整消数据进行回归分析时,可以对数据进行季节调整消除原数据带有的季节性影响,也可以使用虚拟变量描述季节因素,进而可以同时计算出除原数据带有的季节性影响,也可以使用虚拟变量描述季节因素,进而可以同时计算出各个不同季度对经济各个不同季度对经济(jīngjì)(jīngjì)变量的不同影响。
如果用虚拟变量,这时包含了变量的不同影响如果用虚拟变量,这时包含了4 4个季度的个季度的4 4种分类,需要建立种分类,需要建立3 3个虚拟变量用个虚拟变量用QiQi表示第表示第i i个季度取值为个季度取值为1 1,其他季度取值为,其他季度取值为0 0的季节的季节虚拟变量,显然虚拟变量,显然Q1 + Q2 + Q3 + Q4 = 1 Q1 + Q2 + Q3 + Q4 = 1 ,如果模型中包含常数项,则只能加入,如果模型中包含常数项,则只能加入Q1Q1,,Q2Q2,,Q3 Q3 ,否则模型将因为解释变量的线性相关而无法估计,即导致虚拟变量陷阱问题否则模型将因为解释变量的线性相关而无法估计,即导致虚拟变量陷阱问题当使用月度数据时,方法与上述类似,但需要有当使用月度数据时,方法与上述类似,但需要有1111个虚拟变量个虚拟变量 第40页/共88页第四十页,共89页41图图3.1-1 3.1-1 社社会会(shèhuì)(shèhuì)消消费费品品零零售售总总额额RS RS 图图3.1-2 3.1-2 GDPGDP 通过图3.1,可以看出1995年1季度~2003年1季度的季度GDP和社会消费品零售额RS存在明显的季节因素(数据(shùjù)见附录E表E.4),GDP通常逐季增加,也有一些年份中第二季度高于第三季度。
RS在第一季度增加,第二季度减小,第三季度略有上升,第四季度达到高峰第41页/共88页第四十一页,共89页42 下面利用季度数据(shùjù)对我国的国民生产总值GDP和社会消费品零售额RS进行回归分析,分别考虑不包含和包含虚拟变量的情形不包含虚拟变量的回归结果为 (3.3.9) t = (2.53) (14.9) R2= 0.88 D.W. =2.13 使用虚拟变量的回归方程结果为 t = (-4.82) (17.93) (7.58) (6.14) (52.83) (3.3.10) R2= 0.99 D.W. = 1.99第42页/共88页第四十二页,共89页43 可以看出包含虚拟变量的方程明显地改进了拟合能力这种季节调整方法是以季节变动要素不变并且服从于加法模型为前提,否则应该首先(shǒuxiān)运用X-12或其他方法对数据进行季节调整。
图图3.2 SL3.2 SL的实际曲线的实际曲线(qūxiàn)(qūxiàn)(实线)和拟合曲线(实线)和拟合曲线(qūxiàn)(qūxiàn)(虚线)(虚线)( (左、右图分别由式左、右图分别由式 (3.3.9) (3.3.9),,(3.3.10)(3.3.10)得到得到) )第43页/共88页第四十三页,共89页44§3.7 §3.7 估计估计(gūjì)(gūjì)中存在的问题中存在的问题 如果自变量具有高度共线性,EViews 在计算回归估计时会遇到困难在这种情况下,EViews会产生一个显示错误信息对话框 “奇异矩阵”出现这个(zhè ge)错误信息后,应该检查回归变量是否是共线的如果一个回归变量可以写作其他回归变量的线性组合,则回归变量是完全共线的在完全共线的情况下,回归变量矩阵X不是列满秩的,不能计算OLS估计值 第44页/共88页第四十四页,共89页45§3.8 §3.8 定义定义(dìngyì)(dìngyì)和诊断检验和诊断检验 经验研究经常是一种相互影响的过程这一过程从估计关系的定义开始选择定义常含有几个选择:变量,连接这些变量的函数,以及当数据是时间序列时表示变量间关系的动态结构。
不可避免地,在初始定义的恰当性方面存在不确定性一旦估计了方程,EViews提供了评价方程定义质量的工具随着改进,检验结果将影响所选择的定义,这一过程将重复下去,直到方程定义恰当为止 本节描述了在方程对象的View中关于定义检验统计量的多个菜单我们试图提供足够的统计方法来进行(jìnxíng)这些检验,但是实际考虑的许多描述是不完全的,建议查阅标准统计和经济计量学参考资料 第45页/共88页第四十五页,共89页46 下面描述的每一检验过程(guòchéng)包括假设检验的原假设定义检验指令输出包括一个或多个检验统计量样本值和它们的联合概率值(P值) P值说明在原假设为真的情况下,样本统计量绝对值的检验统计量大于或等于临界值的概率P值度量的是犯第一类错误的概率,即拒绝正确的原假设的概率,P值越大,错误地拒绝原假设的可能性就越大;P值越小,拒绝原假设时就越放心例如,如果P值在0.01和0.05之间,原假设在5%显著性水平被拒绝而不是在1%水平切记:对每一检验都有不同假设和分布结果例如,有些检验统计量有确切的有限的样本分布(常为 t 或 F分布)。
其它是服从近似分布的大样本检验统计量每一检验的内容都不同,将分别描述第46页/共88页第四十六页,共89页47 其它(qítā)检验在其它(qítā)章节讨论它们包括单位根检验、Granger因果检验和Johansen协整检验 方程对象(duìxiàng)菜单的View中给出三种检验类型选择来检验方程定义包括系数检验、残差检验和稳定性检验: 第47页/共88页第四十七页,共89页48§3.8.1 系数(xìshù)检验 系数检验对估计系数的约束进行(jìnxíng)评价,包括对遗漏变量和冗余变量特殊情况的检验 一、一、WaldWald检验检验(jiǎnyàn)——(jiǎnyàn)——系数约束条件检验系数约束条件检验(jiǎnyàn) (jiǎnyàn) 1 1. . WaldWald检验原理检验原理 Wald检验没有把原假设定义的系数限制加入回归,通过估计这一无限制回归来计算检验统计量Wald统计量计算无约束估计量如何满足原假设下的约束如果约束为真,无约束估计量应接近于满足约束条件下面给出计算Wald 检验统计量的一般公式。
第48页/共88页第四十八页,共89页49 对于一个(yī ɡè)线性回归模型 一个(yī ɡè)线性约束: 式中R是一个(yī ɡè)已知的 q k 阶矩阵,r 是 q 维向量Wald统计量简写为,b 为没有加入约束得到的参数估计值: W 在H0下服从渐近2(q)分布进一步假设误差独立同时服从正态分布,我们就有一确定的、有限的样本F-统计量 是约束回归的残差向量F统计量比较有约束和没有约束计算出的残差平方和如果约束有效,这两个残差平方和差异很小,F统计量值也应很小EViews显示2 和F统计量以及相应的P值第49页/共88页第四十九页,共89页50 2. 如何进行Wald系数(xìshù)检验 为介绍如何进行Wald系数检验,我们考虑一个例子(lì zi)生产函数的数学形式为 在最初提出的C-D生产函数中,假定参数满足 + =1 ,也就是假定研究(yánjiū)对象满足规模报酬不变 Q 为产出,K 为资本投入,L 为劳动力投入很容易推出参数 , 分别是资本和劳动的产出弹性。
那么由产出弹性的经济意义,应该有 , 即当资本与劳动的数量同时增长倍时,产出量也增长 倍1937年,提出了C-D生产函数的改进型,即取消了 + =1 的假定,允许要素的产出弹性之和大于1或小于1,即承认研究对象可以是规模报酬递增的,也可以是规模报酬递减的,取决于参数的估计结果 第50页/共88页第五十页,共89页51 例3.8 Cobb-Douglas生产函数估计(gūjì)形式如下: 利用美国主要金属工业企业的数据(27个企业的数据),C-D生产函数(hánshù)估计结果如下: (1)第51页/共88页第五十一页,共89页52 从结果看LogL和logK的系数和小于1,但为确定这种差异(chāyì)是统计相关的,我们常进行有约束的Wald系数检验选择View/Coefficient Tests/Wald-Coefficient Restrictions,在编辑对话框中输入约束条件约束条件应表示为含有估计参数和常数(不可以含有序列名)的方程,系数应表示为c(1),c(2)等等,除非在估计中已使用过一个不同的系数向量。
为检验 + =1 的规模报酬不变的假设,在对话框中输入下列约束: c(2) + c(3) = 1单击OK,EViews显示Wald检验如下结果(原假设:约束条件有效): EViews显示F统计量和 2 统计量及相应的P值2 统计量等于F 统计量乘以检验约束条件数本例中,仅有一个约束条件,所以这两个检验统计量等价它们的P值表明我们可以确定地接受规模(guīmó)报酬不变的原假设 第52页/共88页第五十二页,共89页53 下面考虑检验多个约束条件的情况例如,改变前面的C-D生产函数为非线性形式(xíngshì),我们估计一个如下形式(xíngshì)的生产函数 检验约束条件: 这个非线性模型的估计结果(jiē guǒ)如下: 第53页/共88页第五十三页,共89页54 检验多个约束条件,应用逗号隔开约束条件在方程对话框中选择(xuǎnzé)View/Coefficient tests/Wald Coefficient Restrictions在Wald检验对话框中输入如下约束条件:c(4)=0, c(5) = 0,c(6)=0,结果如下: 检验结果是不能拒绝(jùjué)原假设,表明(1)式的Cobb-Douglas生产函数是这一问题较适当的方程定义形式 。
第54页/共88页第五十四页,共89页55二、遗漏变量二、遗漏变量(biànliàng)(Omitted Variables)(biànliàng)(Omitted Variables)检验检验 1. 遗漏变量检验原理 这一检验能给现有方程添加变量,而且询问添加的变量对解释因变量变动是否有显著作用原假设H0是添加变量不显著 检验的输出是 F 统计量和似然比(LR)统计量及各自P值 ,以及在备选假设下无约束模型估计结果F统计量基于(jīyú)约束和无约束回归残差平方和之差LR统计量由下式计算: Lr和Lu是约束和无约束回归(huíguī)对数似然函数的最大值在H0下,LR统计量服从渐近2 分布,自由度等于约束条件数,即加入变量数 第55页/共88页第五十五页,共89页56 注意: (1) 遗漏变量检验要求在原始(yuánshǐ)方程中和检验方程中观测值数相等如果要加入变量的任一序列与原方程样本相比,含有缺失观测值(当加入滞后变量时这种情况常见),检验统计量将无法建立 (2) 遗漏变量检验可应用于线性LS,TSLS,ARCH,Binary, Ordered, Censored, Count模型估计方程。
只有通过列表法列出回归因子定义方程而不能通过公式,检验才可以进行 2. 如何进行遗漏变量检验 选择View/Coefficient Tests/Omitted Variables—Likelihood Ration,在打开的对话框中,列出检验统计量名,用至少一个空格相互隔开 第56页/共88页第五十六页,共89页57 例如:原始回归为: log(q) c log(L) log(k) 输入:K L EViews将显示含有这两个附加解释(jiěshì)变量的无约束回归结果,而且显示原假设:新添变量系数为0 的检验统计量输出的结果如下: 对数似数比统计(tǒngjì)量就是LR检验统计(tǒngjì)量且渐进服从于2 分布,自由度等于添加回归因子数 本例中,检验结果不能拒绝原假设,即添加变量不显著 第57页/共88页第五十七页,共89页58三、冗余三、冗余(rǒnɡ yú)(Redundant Variables)(rǒnɡ yú)(Redundant Variables)变量变量 1. 冗余变量检验原理 冗余变量检验可以检验方程中一部分变量的统计显著性。
更正式,可以确定方程中一部分变量系数是否为0,从而(cóng ér)可以从方程中剔出去原假设:被检验变量系数为0冗余变量检验可以应用于线性LS,TSLS,ARCH(仅均值方程),Binary, Ordered, Censored, Count模型估计方程只有以列表法列出回归因子形式,而不是公式定义方程,检验才可以进行 2. 如何进行冗余变量检验 选择View/Coefficient Tests/Redundant Variable—likelihood Ratio,在对话框中,输入每一检验的变量名,相互间至少用一空格隔开 第58页/共88页第五十八页,共89页59 例如:原始回归为 log(Q) c log(L) log(K) K L 如果输入增加的变量K和L ,EViews显示去掉这两个回归因子的约束回归结果,以及检验(jiǎnyàn)原假设:被检验(jiǎnyàn)变量系数为0 的统计量结果如下: 检验统计量是F统计量和对数似然比如果误差(wùchā)是独立正态分布随机变量,F统计量有确定有限样本F分布,分子自由度为原假设下系数约束条件数,分母自由度为总回归自由度。
LR检验是渐近检验,服从2 分布 第59页/共88页第五十九页,共89页60§3.8.2 §3.8.2 残差检验残差检验(jiǎnyàn) (jiǎnyàn) EViews提供了对估计方程(fāngchéng)残差的序列相关,正态性,异方差性和自回归条件异方差性检验第60页/共88页第六十页,共89页61 (1) (1) 相关图和相关图和统计量统计量 (2) (2) 平方残差相关图平方残差相关图 (3) (3) 残差直方图和正态检验残差直方图和正态检验 显示残差直方图和残差的描述统计量,包括检验残差正态性的显示残差直方图和残差的描述统计量,包括检验残差正态性的Jarque-BeraJarque-Bera统计量如果残差统计量如果残差服从正态分布,直方图应呈钟型,服从正态分布,直方图应呈钟型,J-BJ-B统计量应不显著也适用于统计量应不显著也适用于LSLS,,TSLSTSLS,非线性,非线性LSLS等模型等模型残差选择残差。
选择View/Residual Tests/Histogram NormalityView/Residual Tests/Histogram Normality显示直方图和显示直方图和J-BJ-B统计量在原假设统计量在原假设(jiǎshè):(jiǎshè):残差正态分布下,残差正态分布下,J-BJ-B统计量应服从统计量应服从2 2 分布,自由度为分布,自由度为2 2 (4) (4) 序列相关序列相关LMLM检验检验 (5) ARCH LM (5) ARCH LM检验检验 (6) White (6) White异方差性检验异方差性检验第61页/共88页第六十一页,共89页62§3.8.3 §3.8.3 定义定义(dìngyì)(dìngyì)和稳定性检验和稳定性检验 一个推荐的经验方法是把观测值区间T分为T1和T2两部分T1个观测值用于估计,T2个观测值用于检验和评价把所有样本数据用于估计,有利于形成最好的拟合,但没有考虑到模型检验,也无法检验参数不变性,估计关系的稳定性。
检验预测效果要用估计时未用到的数据,建模时常用T1区间估计模型,用T2区间检验和评价效果对于子区间T1和T2的相对大小,没有太明确的规则有时可能会出现明显(míngxiǎn)的结构变化的转折点,例如战争,石油危机等当看不出有转折点时,常用的经验方法是用85%-90%的数据作估计,剩余的数据作检验 EViews提供了一些检验统计量选项,它们检查模型参数(cānshù)在数据的不同子区间是否平稳第62页/共88页第六十二页,共89页631. Chow分割(fēngē)点检验 Chow分割点检验的思想是对每一个子样本区间估计方程,看估计方程中是否存在显著差异显著差异说明关系中存在结构变化(biànhuà)例如,可以使用这个检验来检查石油危机前后的能源需求函数是否一样 为进行检验,把数据分为两个或多个子样本区间,每一子区间包含的观测值数应大于方程参数,这样才使得方程能被估计Chow分割点检验基于比较利用整个样本估计方程获得的残差平方和及利用每一子区间样本估计方程获得的残差平方和之间的差别 对Chow分割点检验,EViews提供了两个检验统计量。
F统计量和对数似然比(LR)统计量 ,F统计量基于对约束和非约束残差平方和的比较在最简单情况下(一个分割点),计算如下: 第63页/共88页第六十三页,共89页64 Chow分割点检验的原假设:不存在结构变化Chow分割点检验的主要缺陷是,如果(rúguǒ)每一个子区间要求至少和被估计参数一样多的样本数,那么这里就存在一个问题,比如说,要检验战争和和平时期的结构变化,但是战争时期的样本数较少下面要讨论的Chow预测检验可以解决这个问题 其中: 是整个样本期间估计的残差平方和; 是第 i 个子区间的残差平方和;T 是观测值数;k 是方程参数个数,这一公式(gōngshì)可以扩展为多于一个分割点第64页/共88页第六十四页,共89页65 为了进行Chow分割点检验,选择View/Stability Tests/Chow Breakpoint Test…出现对话框以后,填入间断点的日期比如,如果方程的数据是从1978到2002年,填入1994,则被定义成两个子区间:一个是1978到1993,另一个是1994到2002 例3.9 我们利用Chow检验来判断例3.1所建立的消费函数的稳定性。
20世纪90年代前的中国仍然处于卖方市场,虽然居民收入水平增幅较大,但商品供给有限,而且当时的利息率较高,因而居民收入更加倾向于储蓄增值而不是立即消费1994年我国开始了全面(quánmiàn)的体制改革和制度创新,随着国有企业体制改革的推进和大量非国有企业的兴起并日益壮大,国内商品市场日益繁荣,商品品种更加丰富,使得居民收入用于消费的部分增加不妨以1994年为假想的间断点,用Chow检验判断1994之前和之后的两段时期消费函数是否产生了显著的差异 该结果是拒绝原假设 (不存在结构变化):即1994前后存在结构变化 第65页/共88页第六十五页,共89页66 Chow预测检验先估计了包括T1区间子样本的所有样本观测值的模型,然后用同样的模型去估计T1区间样本的因变量的值如果两个估计值差异很大,就说明模型可能不稳定检验适用(shìyòng)于最小二乘法和二阶段最小二乘法 EViews给出F统计量计算如下: 这里 用所有样本观测值估计方程的残差平方和, 是用T1子样本进行估计方程的残差平方和,k 是被估计参数的个数。
当误差是独立同正态分布时,F统计量服从精确的有限样本的F分布 2. Chow2. Chow预测预测(yùcè)(yùcè)检验检验 第66页/共88页第六十六页,共89页67 选择View/Stability Test /Chow Forecast Test进行Chow预测检验对预测样本开始时期或观测值数进行定义数据应在当前(dāngqián)观测值区间内 仍以例3.1所建立的消费函数为例,定义1994作为预测区间第一个分割点检验重新估计1978—1994的方程,并且使用这个结果来计算剩余时期的预测误差结果如下: 对数似然比(LR)统计(tǒngjì)量拒绝原假设,中国的消费函数在1994年前后有结构变化,但F统计(tǒngjì)量不能拒绝原假设 注意:本例说明两种Chow检验产生相同的结果但有时也会产生相反的结果 第67页/共88页第六十七页,共89页68§3.9 EViews中的方程(fāngchéng)预测 为说明一个被估计方程的预测过程,我们仍然考虑例3.1中的模型,如果要对此模型的预测功能进行评价,可以用1978~1999年的22年数据进行参数估计,用2000~2002年的数据作为(zuòwéi)检验性数据,考察实际值和预测值的差别。
第68页/共88页第六十八页,共89页69用1978~2004年的22年数据进行(jìnxíng)参数估计的结果: 第69页/共88页第六十九页,共89页70 §3.9.1 如何(rúhé)进行预测 为预测该方程的实际消费csp,在方程的工具栏中按Forecast按钮,或选择(xuǎnzé)Procss/ Forecast …这时会出现对话框: 第70页/共88页第七十页,共89页71 我们应提供如下信息: 1. 序列名 预测后的序列名 将所要预测的因变量名填入编辑框中EViews默认了一个名字,但可以将它变为任意别的有效序列名这个名字应不同于因变量名,因为(yīn wèi)预测过程会覆盖已给定的序列值 S.E.(Optional) 如果需要,可以为该序列的预测标准差提供一个名字如果省略该项,预测标准误差将不被保存 GARCH(Optional) 对用ARCH估计的模型,还可以保存条件方差的预测值(GARCH项)见6章对GARCH估计的讨论 第71页/共88页第七十一页,共89页。
72 2. 预测方法 动态(Dynamic)— 从预测样本的第一期开始计算多步预测 静态(Static)— 利用滞后因变量的实际值计算一步向前(one-step-ahead)预测的结果 结构(Structural)—预测时EViews将忽略(hūlüè)方程中的任何ARMA项若不选此项,在方程中有ARMA项时,动态与静态方法都会对残差进行预测但如果选择了Structural,所有预测都会忽略(hūlüè)残差项而只对模型的结构部分进行预测 样本区间(Sample range)— 必须指定用来做预测的样本如果缺选,EViews将该样本置为工作文件样本如果指定的样本超出估计方程所使用的样本区间(估计样本),那么会使EViews产生样本外预测 注意:需要提供样本外预测期间的解释变量值对静态预测,还必须提供滞后因变量的数值第72页/共88页第七十二页,共89页73 3. 输出 可以选择以图表或数值,或者二者同时的形式来观察预测值注意:预测值被保存在csf序列中因为csf序列是一个标准的EViews序列,所以可以利用序列对象(duìxiàng)的所有标准工具来检验预测结果。
第73页/共88页第七十三页,共89页74比较实际值csp和预测(yùcè)拟合值cspf: 第74页/共88页第七十四页,共89页75 对于没有包含在预测样本中的数值,会有两种选择作为缺省,EViews将用其因变量的实际值充填,另一种是不选择Insert actuals for out-of-sample,预测样本外的数值将都赋予“NA”于是,这些规则的结果是被预测序列中的所有数据在预测过程中将被覆盖(fùgài),被预测序列的已存值将会丢失 第75页/共88页第七十五页,共89页76 §3.9.2 预测误差(wùchā)和预测效果评估 假设真实的模型由下式给定: 这里 ut 是独立同分布,均值为零的随机扰动项, 是未知参数向量下面我们放松 ut 是独立的限制 生成 y 的真实模型我们尚不知道,但我们得到(dé dào)了未知参数 的估计值b设误差项均值为零,可以得到(dé dào) y 的预测方程: 该预测(yùcè)的误差为实际值与预测(yùcè)值之差 第76页/共88页第七十六页,共89页77 假设我们利用1979~2004的样本数据估计出的cs方程,然后分别(fēnbié)进行2005~2006关于csp的预测。
如果选中Forecast evaluation (预测效果评估),EViews将显示预测效果评估的统计结果表: 第77页/共88页第七十七页,共89页78 注意:如果预测样本中没有因变量的实际(shíjì)值数据,EViews不能进行预测效果评估 假设预测样本为 j =T+1, T+2, …,T+h,T 为实际(shíjì)估计用样本长度,用 和 yt 分别表示 t 期的实际(shíjì)值与预测值计算出的预测误差统计结果如下所示: Root Mean Squared Error 均方根误差均方根误差 Mean Absolute Percentage Error 平均绝对误差平均绝对误差 Mean Absolute Percentage Error 平均相对误差平均相对误差 Theil Inequality Coefficient 泰尔不等系数泰尔不等系数 第78页/共88页第七十八页,共89页79 前两个预测误差统计量由因变量规模决定它们应该被作为相对指标来比较同样的序列在不同模型中的预测结果(jiē guǒ),误差越小,该模型的预测能力越强。
后两个统计值是相对量泰尔(Theil)不等系数总是处于0和1之间,这里0表示与真实值完全拟合 预测均方差可以分解为: 式中 分别(fēnbié)为 和 y 的平均值和标准差,r为 和 y 的相关系数该比值被定义为: 第79页/共88页第七十九页,共89页80 Bias Proportion 偏差比偏差比 Variance Proportion 方差比方差比 Covariance Proportion 协方差比协方差比 偏差比表明预测均值与序列实际值的偏差程度;方差比表明预测方差与序列实际方差的偏离程度;协方差比衡量非系统误差的大小(dàxiǎo) 注意:偏差比、方差比和协方差比之和为1 如果预测结果好,那么偏差比和方差比应该较小,协方差比较大第80页/共88页第八十页,共89页81§3.9.4 §3.9.4 含有滞后含有滞后(zhì hòu)(zhì hòu)因变量的预测因变量的预测 在方程等号的右边出现滞后变量时,预测变得更为(ɡènɡ wéi)复杂。
例如,我们可以在原来的形式后面引入csp的一阶滞后: csp c inc csp(-1) 第81页/共88页第八十一页,共89页82 1. 1.动态预测动态预测 如如果果选选择择动动态态预预测测,,EViewsEViews将将从从预预测测样样本本的的起起始始日日期期开开始始,,对对 y y 进进行行多多步步预预测测对对如如上只指定上只指定(zhǐdìng)(zhǐdìng)一个滞后变量的情况:一个滞后变量的情况: 预预测测样样本本的的初初始始值值将将使使用用滞滞后后变变量量 y y 的的实实际际值值因因此此,,如如果果 y y 的的实实际际样样本本值值是是T T个,我们从个,我们从T +1T +1开始预测,即开始预测,即T +1T +1是第一个预测值,是第一个预测值,EViewsEViews将计算将计算这这里里 yT yT 是是预预测测样样本本开开始始前前一一期期的的滞滞后后内内生生变变量量值值,,这这就就是是一一步步向向前前预预测测随随后后的的h h个个预预测测值,值,k = 1 , 2 , … , hk = 1 , 2 , … , h,将使用前期,将使用前期 y y 的预测值:的预测值: 第82页/共88页第八十二页,共89页。
83 2. 静态预测 静态预测对因变量进行一系列的一步向前预测: EViews采用滞后内生变量的实际值,通过(tōngguò)下式对 k =0 , 1 , 2 , … , h 计算每一个预测值: 静态预测要求外生变量和任何滞后内生变量在预测样本中的观测值可以获得如上,如果需要,EViews将对预测样本进行(jìnxíng)调整以解释滞后变量的前期样本如果没有某期数据,对应该期的预测值为NA它并不会对以后预测产生影响 第83页/共88页第八十三页,共89页84 动态预测和静态(jìngtài)预测的比较第84页/共88页第八十四页,共89页85§3.9.5 带有公式(gōngshì)的预测方程 EViews可以(kěyǐ)提供对方程左边的因变量是某个表达式的情况,预测这个表达式的功能而且如果公式中的第一个序列,能从表达式求解出来,那么EViews还可以(kěyǐ)提供预测公式中第一个序列的功能 第85页/共88页第八十五页,共89页86 例如,假设估计如下定义的方程(fāngchéng): log(cs) c log(cs(-1)) log(inc) 当选择Forecast按钮,预测对话框显示如下,注意该对话框提供了两种预测序列以供选择:第一个序列cs与表达式 log(cs) 。
第86页/共88页第八十六页,共89页87 但是,如果将方程定义为: x+1/x=c(1)+c(2)*y EViews就不能求解(qiú jiě)出第一个序列X,而只能预测表达式了预测对话框如下: 第87页/共88页第八十七页,共89页88感谢您的欣赏(xīnshǎng)!第88页/共88页第八十八页,共89页内容(nèiróng)总结1有两种说明方程的基本方法:列表法和公式法要创建(chuàngjiàn)新的系数向量,选择Object/New ObjectSchwarz准则是AIC准则的替代方法:其它检验在其它章节讨论只有通过列表法列出回归因子定义方程而不能通过公式,检验才可以进行感谢您的欣赏第八十九页,共89页。