第三章 经典假设条件不满足时的问题与对策

上传人:bin****86 文档编号:54382996 上传时间:2018-09-12 格式:PPT 页数:241 大小:1.97MB
返回 下载 相关 举报
第三章 经典假设条件不满足时的问题与对策_第1页
第1页 / 共241页
第三章 经典假设条件不满足时的问题与对策_第2页
第2页 / 共241页
第三章 经典假设条件不满足时的问题与对策_第3页
第3页 / 共241页
第三章 经典假设条件不满足时的问题与对策_第4页
第4页 / 共241页
第三章 经典假设条件不满足时的问题与对策_第5页
第5页 / 共241页
点击查看更多>>
资源描述

《第三章 经典假设条件不满足时的问题与对策》由会员分享,可在线阅读,更多相关《第三章 经典假设条件不满足时的问题与对策(241页珍藏版)》请在金锄头文库上搜索。

1、第三章 经典假设条件不满足时的问题及对策,2,本章内容 第一节 误设定 第二节 多重共线性 第三节 异方差性 第四节 自相关 第五节 随机解释变量,3,OLS估计量令人满意的性质,是根据一组假设条件而得到的。在实践中,如果某些假设条件不能满足,则OLS就不再适用于模型的估计。下面列出实践中可能碰到的一些常见问题:,4, 误设定(Misspecification 或specification error) 多重共线性(Multicollinearity) 异方差性(Heteroscedasticity或Heteroskedasticity) 自相关(Autocorrelation) 随机解释变量

2、(Stochastic explanatory variables)本章将对上述问题作简要讨论,主要介绍问题的后果、检测方法和解决途径。,5,第一节 误设定采用OLS法估计模型时,实际上有一个隐含的假设,即模型是正确设定的。这包括两方面的含义:函数形式正确和解释变量选择正确。在实践中,这样一个假设或许从来也不现实。我们可能犯下列三个方面的错误:选择错误的函数形式遗漏有关的解释变量包括无关的解释变量 从而造成所谓的“误设定”问题。,6,这类错误中比较常见的是将非线性关系作为线性关系处理。函数形式选择错误,所建立的模型当然无法反映所研究现象的实际情况,后果是显而易见的。因此,我们应当根据实际问题,

3、选择正确的函数形式。,一、选择错误的函数形式,7,我们在前面各章的介绍中采用的函数形式以线性函数为主,上一章还介绍了因变量和解释变量都采用对数的双对数模型,下面再介绍几种比较常见的函数形式的模型,为读者的回归实践多提供几种选择方案。这几种模型是:半对数模型双曲函数模型多项式回归模型,8,1. 半对数模型半对数模型指的是因变量和解释变量中一个为对数形式而另一个为线性的模型。因变量为对数形式的称为对数-线性模型(log-lin model)。解释变量为对数形式的称为线性-对数模型(lin-log model)。,9,我们先介绍前者,其形式如下:对数-线性模型中,斜率的含义是Y的百分比变动,即解释变

4、量X变动一个单位引起的因变量Y的百分比变动。这是因为,利用微分可以得出:,10,这表明,斜率度量的是解释变量X的单位变动所引起的因变量Y的相对变动。将此相对变动乘以100,就得到Y的百分比变动,或者说得到Y的增长率。由于对数-线性模型中斜率系数的这一含义,因而也叫增长模型 (growth model)。增长模型通常用于测度所关心的经济变量(如GDP)的增长率。例如,我们可以通过估计下面的半对数模型得到一国GDP的年增长率的估计值,这里t为时间趋势变量。,11,案例1 测算1978-2007中国国内生产总值的增长率,12,13,14,案例2:19492003年的中国人口增长率,斜率0.01685

5、表示,平均而言,中国人口的年增长率为0.01685,即人口以每年1.685的速度增长。截距项10.924可解释为: 10.924log(Y0),即Y0 55475.68,可解释为1948年的人口数。,15,线性趋势模型,斜率1489.92表示,在样本区间内,中国人口以每年1489.92万的绝对速度增长。截距项50377.6可解释为1948年的人口数。,16,增长模型与线性趋势模型,实践中,线性趋势模型和增长模型应用得十分广泛。但相对而言,增长模型更有用些。人们通常关注的是经济变量的相对变化而不是绝对变化。但应注意的是,不能比较这两个模型的r值,因为两个模型因变量不同。近来,新一代时间序列经济计

6、量学家对这两个模型引入时间趋势t提出了质疑。他们认为,只有在随机项u是平稳的条件下,引入时间趋势t才合理。,17,Eviews命令 create data Yt genr ttrend(起始年份) genr lnYt =log(Yt) ls lnYt c t,18,线性-对数模型的形式如下:,与前面类似,我们可用微分得到,这表明,因此,19,上式表明,Y的绝对变动量等于 乘以X的相对变动量。因此, 线性-对数模型通常用于研究解释变量每变动1%引起的因变量的绝对变动量是多少这类问题。,2.双曲函数模型,双曲函数模型的形式为:,20,不难看出,这是一个仅存在变量非线性的模型,很容易用重新定义的方法

7、将其线性化。双曲函数模型的特点是,当X趋向无穷时,Y趋向 ,反映到图上,就是当X趋向无穷时,Y将无限靠近其渐近线(Y= )。双曲函数模型通常用于描述著名的恩格尔曲线和菲利普斯曲线。,21,多项式回归模型通常用于描述生产成本函数,其一般形式为:其中Y表示长期平均成本LAC,Q表示产出,P为多项式的阶数,一般不超过四阶。多项式回归模型中,解释变量X以不同幂次出现在方程的右端。这类模型也仅存在变量非线性,因而很容易线性化,可用OLS法估计模型。,3. 多项式回归模型,22,Eviews命令 create data Yi Q genr x1Q genr X2 = x1 *Q genr xp= xp-1

8、 *Q ls Yi c x1 X2 xp,23,三、 包括无关的解释变量模型中包括无关的解释变量,参数估计量仍无偏,但会增大估计量的方差,即增大误差。,二、 遗漏有关的解释变量模型中遗漏了对因变量有显著影响的解释变量的后果是:将使模型参数估计量不再是无偏估计量。,注 有关上述两点结论的说明请参见教科书P112-113。,24,四、 解决解释变量误设定问题的原则,在模型设定中的一般原则是尽量不漏掉有关的解释变量。因为估计量有偏比增大误差更严重。但如果方差很大,得到的无偏估计量也就没有多大意义了,因此也不宜随意乱增加解释变量。在回归实践中,有时要对某个变量是否应该作为解释变量包括在方程中作出准确的

9、判断确实不是一件容易的事,因为目前还没有行之有效的方法可供使用。尽管如此,还是有一些有助于我们进行判断的准则可用,它们是:,25,选择解释变量的四条准则,1.理论: 从理论上看,该变量是否应该作为解释变量包括在方程中? 2. t检验:该变量的系数估计值是否显著?:该变量加进方程中后, 是否增大? 4. 偏倚: 该变量加进方程中后,其它变量的系数估计值是否显著变化?,如果对四个问题的回答都是肯定的,则该变量应该包括在方程中;如果对四个问题的回答都是“否”, 则该变量是无关变量,可以安全地从方程中删掉它。,26,但根据以上准则判断并不总是这么简单。在很多情况下,这四项准则的判断结果会出现不一致。例

10、如,有可能某个变量加进方程后, 增大,但该变量不显著。因此,当这四项用于判断一个变量是否应加进回归方程的准则出现不一致的情况时,应当特别小心。在这种情况下,作出正确判断不是一件容易的事,但可以让事情变得容易一些,办法是将理论准则放在第一位,再多的统计证据也不能将一个理论上很重要的变量变成“无关”变量。在选择变量的问题上,应当坚定不移地根据理论而不是满意的拟合结果来作决定,对于是否将一个变量包括在回归方程中的问题,理论是最重要的判断准则。如果不这样做,产生不正确结果的风险很大。,27,*五、模型的选择上一段讨论了某个解释变量应否包括在模型中的几条原则。实践中,要解决的一个问题是如何从大量的潜在解

11、释变量的集合中选择一个最合适的子集,以得到一个正确设定的模型。上个世纪六十年代后相当一段时间,人们使用逐步回归法来解决解释变量的选择问题。这种由计算机机械挑选变量的做法如今已不流行了。目前比较通行的做法是从少量精心设定的备选模型中选择一个。计量经济学家就此提出了很多基于统计学的选择标准,我们这里讨论其中几种,如表51所示。,28,令RSSj表示第j个模型(有kj个解释变量)的残差平方和,并定义为第j个模型的的 估计值。我们 用表示包含全部k个解释变量的模型的 估计值。,29,表51 选择回归模型的准则,准则 计算公式,30,1. 准则希尔(Theil)的 准则基于如下假设:所考虑的模型中有一个

12、是正确模型。对于正确模型, ,对于不正确模型, 。因此,选择 最小的模型一般就能选出正确模型。由于 最小化与 最大化是一回事,我们习惯上称该准则为 最大准则。这个准则的主要问题是,一个包括正确模型的所有解释变量但同时也包括一些无关变量的模型也会给出 ,在这种情况下,我们所选择的其实并非正确模型。当备选模型包含大量无关变量时,选出正确模型的概率较低。,31,在一个实际问题的回归建模中, 越大,所对应的回归方程越好。如果我们仅从拟合的角度追求“最优”,则所有回归子集中 最大者对应的回归模型就是“最优”模型。,32,2. 基于预测的均方误差最小的三个准则希尔的准则是基于回归的标准误差最小,下列三个准

13、则则是基于预测的均方误差(MSE)最小。这三个准则是:马娄斯(Mallows)的 准则霍金(Hocking)的 准则阿美米亚(Amemiya)的PC准则假设正确的方程有k个解释变量,我们考虑的方程有 个解释变量,问题是如何选择k1以及具体的k1个解释变量的集合。在上述三个预测准则中,这是通过使的均方误差 达到最小实现的,其中 是Y的未来值,而 是预测值。,33,上述三个准则都是基于预测的均方误差最小,但在估计预测的均方误差时采用的假设有所不同,因而形成各自的计算公式,孰优孰劣,并无定论,在实践中可根据所用软件提供的输出结果选用其中一个作为模型选择的准则。具体做法是比较备选的几个模型的、 或PC

14、值,选其中最小的即可。在三个预测准则的情况下,我们感兴趣的是改善预测的MSE,只要能改善,可以去掉某些变量,即便是正确模型中包括它们也在所不惜。,34,3. 赤池信息准则(AIC)赤池信息准则(Akaikes Information Criterion,AIC)是一个更一般的准则,它可以应用于任何一个可用极大似然法估计的模型。对于我们这里的应用,AIC的计算公式为与赤池信息准则类似的还有施瓦茨信息准则(Schwarz information criterion,SIC):上述两个准则与前述准则 一样,可用于模型选择,其值也是越小越好。,35,在回归分析的建模过程中,对每一个回归子集计算AIC,

15、其中AIC最小者所对应的模型是“最优”回归模型。AIC准则只能用于比较同一种方法拟合得到的回归模型。,36,下面用一个实际经济例子,对所有回归子集计算上述四个统计量,综合比较一下“最优”回归子集的选择。,【例】用y表示某种消费品的销售额,x1表示居民可支配收入,x2表示该类消费品的价格指数,x3表示其他消费品平均价格指数。表中给出了某地区18年来某种消费品情况资料,试建立该地区该消费品销售额预测方程。,37,38,39,由5项指标均可看出x1,x2,x3是“最优”子集,x1,x3是“次优”子集。因为这个实际问题所涉及的自变量本来就较少,所以从几个准则看到全模型是“最优”的。这种情况在自变量只有

16、少数几个时是常见的,但当涉及的自变量数目较多时,很少见到全模型是最优的。,40,再说我们讲的最优是相对而言,在实际问题的选模中,应综合考虑,或根据实际问题的研究目的从不同最优角度来考虑。如有时希望模型各项衡量准则较优,得到的模型又能给出合理的经济解释;有时只从拟合角度考虑;有时只从预测角度考虑,并不计较回归方程能否有个合理解释;有时要求模型的各个衡量准则较优,而模型最好简单些,涉及变量少些;有时还看回归模型参数估计的标准误差大小等。从本例来看,x1,x2,x3和x1,x3和x1,x2模型相对较好,但从实际经济角度考虑,x2和x3相关度很高,所以应选择x1,x3或x1,x2;或转换变量,采用新变量x4x2/x3。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号