违背古典假定的计量经济模型新ppt课件

上传人:ni****g 文档编号:568664594 上传时间:2024-07-26 格式:PPT 页数:156 大小:944.50KB
返回 下载 相关 举报
违背古典假定的计量经济模型新ppt课件_第1页
第1页 / 共156页
违背古典假定的计量经济模型新ppt课件_第2页
第2页 / 共156页
违背古典假定的计量经济模型新ppt课件_第3页
第3页 / 共156页
违背古典假定的计量经济模型新ppt课件_第4页
第4页 / 共156页
违背古典假定的计量经济模型新ppt课件_第5页
第5页 / 共156页
点击查看更多>>
资源描述

《违背古典假定的计量经济模型新ppt课件》由会员分享,可在线阅读,更多相关《违背古典假定的计量经济模型新ppt课件(156页珍藏版)》请在金锄头文库上搜索。

1、第四章第四章 违背古典假定的计量经济模型违背古典假定的计量经济模型*概述概述*异方差异方差*自相关自相关*随机解释变量随机解释变量*多重共线性多重共线性 第一节第一节 概述概述一、古典假定一、古典假定 假定假定1、随机、随机项i具有零均具有零均值 E(i)=0 i=1,2, , n 假定假定2、随机、随机项i具有同方差具有同方差 Var (i)=2 i=1,2, , n 假定假定3、随机、随机项i无序列相关性无序列相关性 Cov(i, j)=0 ij i,j= 1,2, , n 假定假定4、随机、随机项与解与解释变量量X之之间不相关:不相关: Cov(Xj, i)=0 i=1,2, , n 假

2、定假定5、服从正服从正态分布分布 iN(0, 2 ) i=1,2, , n 假定假定6、多元回、多元回归模型中解模型中解释变量之量之间不存在多不存在多重共重共线性性 rank(X)=k+1 k+1n 根据根据Gauss-Markov定理可知,古典回定理可知,古典回归模模型的最小二乘估型的最小二乘估计量量OLSE是是线性无偏有性无偏有效的估效的估计量,而且由于正量,而且由于正态性假定,它性假定,它们服从服从正正态分布的。因此,就有能分布的。因此,就有能够得出区得出区间估估计式,式,而且也可以而且也可以检验真真实总体回体回归系数。系数。二、古典假定的违背及呵斥的后果二、古典假定的违背及呵斥的后果

3、在实践经济问题中,上述的古典假定在实践经济问题中,上述的古典假定不一定都能得到满足。假设这些假定不不一定都能得到满足。假设这些假定不完全满足,那么完全满足,那么OLSE的的BLUE特性将不特性将不复存在。当然,每一个假定不满足所呵复存在。当然,每一个假定不满足所呵斥的后果是不同的。在本章中,我们将斥的后果是不同的。在本章中,我们将严厉调查上述假定,找出假设有一个或严厉调查上述假定,找出假设有一个或多个假定得不到满足时,估计量的性质多个假定得不到满足时,估计量的性质将会发生什么变化将会发生什么变化 ,并研讨当出现这些情并研讨当出现这些情况时,应该如何处置,即古典模型假定况时,应该如何处置,即古典

4、模型假定违背的经济计量问题。违背的经济计量问题。 关于假定关于假定1,普通地我,普通地我们以以为假定假定E(i)=0 是合理的。由于随机是合理的。由于随机项 是多种要素的是多种要素的综合,而合,而每种要素的影响都每种要素的影响都“均匀地微小,它均匀地微小,它对因因变量的影响不是系量的影响不是系统的,且正的,且正负影响相互抵消,影响相互抵消,故一切能故一切能够取取值平均起来平均起来为零。即使有零。即使有轻度的度的违反,从反,从实际的的观念来看能念来看能够不会不会产生生严重的重的后果,由于它能后果,由于它能够只影响回只影响回归方程的截距方程的截距项 。 关于随机关于随机项正正态性分布的假定,假性分

5、布的假定,假设我我们的的目的目的仅仅是估是估计,这种假定并不是种假定并不是绝对必要的。必要的。现实上,无上,无论能否是正能否是正态分布,分布,OLSE估估计式式都是都是BLUE。 剩下的四个假定将在下面的四剩下的四个假定将在下面的四节中分中分别加以加以讨论。三、广义最小二乘法三、广义最小二乘法GLS 给定定线性回性回归模型模型 Y=X+U 假假设古典假定完全古典假定完全满足,根据足,根据Gauss-Markov定理,其系数的最小定理,其系数的最小二乘估二乘估计量量 B (XT X) 1 XT Y 具有具有 BLUE性性质。 假假设古典假定得不到完全古典假定得不到完全满足,足,特特别是假定是假定

6、2同方差性和假定同方差性和假定3无序列相关性得不到无序列相关性得不到满足足时,对OLSE的影响更大。的影响更大。 广广义最小二乘法最小二乘法General Least SquaresGLS就是就是为理理处理上述理上述问题提出的。其根提出的。其根本思本思绪是:假是:假设 假定假定2同方差性和假定同方差性和假定3无序列相关性得不到无序列相关性得不到满足足时,我,我们可以可以采取适当的采取适当的变换,使原模型,使原模型变为以下的方式:以下的方式: 使得其中使得其中 的重新的重新满足假定足假定2同方差性同方差性和假定和假定3无序列相关性。无序列相关性。这样就可以就可以对上上式运用式运用OLS估估计参数

7、,从而使得上式的参数,从而使得上式的OLSE依然依然为BLUE。 假假设因假定因假定2和假定和假定3不不满足足时,有,有 其中其中I, 是一个是一个nn的正定的正定对称方称方阵。 此此时可可以可可以觅得一个得一个nn的非奇特矩的非奇特矩阵P,使得:,使得: P PT=I 然后用然后用觅得的得的P乘以原模型的两乘以原模型的两边,有:,有: PY=PX+PU 记 原模型就原模型就转换为: 可可证明明转换后的模型其随机后的模型其随机项满足同方差性和无序足同方差性和无序列相关性,即可以采用列相关性,即可以采用OLS估估计参数了。参数了。第二节第二节 异方差性异方差性一、异方差的涵义一、异方差的涵义二、

8、异方差性的后果二、异方差性的后果三、异方差的检验三、异方差的检验四、异方差的消除方法四、异方差的消除方法五、案例五、案例对于模型对于模型假假设出出现即即对于不同的于不同的样本点,随机本点,随机误差差项的方差不再的方差不再是常数,而互不一是常数,而互不一样,那么以,那么以为出出现了异方差了异方差性性(Heteroscedasticity)。 一、异方差的概念一、异方差的概念异方差举例异方差举例例:截面资料下研讨居民家庭的储蓄行为例:截面资料下研讨居民家庭的储蓄行为 Yi= 0+ 1Xi+uiYi:第第i个家庭的储蓄额个家庭的储蓄额 Xi:第第i个家庭的可支个家庭的可支配收入配收入 高收入家庭:储

9、蓄的差别较大高收入家庭:储蓄的差别较大 低收入家庭:储蓄那么更有规律性,差别低收入家庭:储蓄那么更有规律性,差别较小较小ui的方差呈现单调递增型变化的方差呈现单调递增型变化 例例 以某一行以某一行业的企的企业为样本建立企本建立企业消消费函数函数模型模型 Yi=A LiKiei 被解被解释变量:量:产出量出量Y 解解释变量:量:资本本K、劳动力力L 那那么么:每每个个企企业所所处的的外外部部环境境对产出出量量的的影影响被包含在随机响被包含在随机误差差项中。中。 每每个个企企业所所处的的外外部部环境境对产出出量量的的影影响响程程度度不同,呵斥了随机不同,呵斥了随机误差差项的异方差性。的异方差性。

10、这时,随随机机误差差项的的方方差差并并不不随随某某一一个个解解释变量量观测值的的变化而呈化而呈规律性律性变化,呈化,呈现复复杂型。型。异方差产生的缘由:异方差产生的缘由:一模型中省略的解释变量;一模型中省略的解释变量;二丈量的误差;二丈量的误差;三截面数据中总体各单位的差别三截面数据中总体各单位的差别 二、异方差产生的后果二、异方差产生的后果 计量量经济学模型一旦出学模型一旦出现异方差性,异方差性,假假设仍采用仍采用OLSOLS估估计模型参数,会模型参数,会产生以下不生以下不良后果:良后果: 1 1、参数估、参数估计量非有效量非有效 OLS估估计量依然具有无偏性,但不具有有效性量依然具有无偏性

11、,但不具有有效性 由于在有效性由于在有效性证明中利用了明中利用了 E(uuT)= 2I 而且,在大而且,在大样本情况下,本情况下,虽然参数估然参数估计量具有量具有一致性,但依然不具有一致性,但依然不具有渐近有效性。近有效性。 2、变量的显著性检验和置信区间失去意义、变量的显著性检验和置信区间失去意义 变量的量的显著性著性检验中,构造了中,构造了t统计量量 t = b1/s(b1) 它是建立在它是建立在2不不变而正确估而正确估计了参数方差了参数方差s(b1)的根底之上的。的根底之上的。 假假设出出现了异方差,估了异方差,估计的的s(b1)出出现偏偏误偏大或偏小,偏大或偏小,t检验失去意失去意义。

12、 其他其他检验也是如此。也是如此。 3 、参数方差的估计量是有偏的、参数方差的估计量是有偏的 虽然最小二乘法参数的估计量是无偏虽然最小二乘法参数的估计量是无偏的,但这些参数方差的估计量、是有偏的,但这些参数方差的估计量、是有偏的。正的偏向会高估参数估计值的真实的。正的偏向会高估参数估计值的真实方差,负的偏向会低估参数估计值的真方差,负的偏向会低估参数估计值的真实方差。实方差。 4 4、模型的预测失效、模型的预测失效 一一方方面面,由由于于上上述述后后果果,使使得得模模型型不不具有良好的具有良好的统计性性质; 所以,当模型出所以,当模型出现异方差性异方差性时,参数,参数OLS估估计值的的变异程异

13、程度增大,从而呵斥度增大,从而呵斥对Y的的预测误差差变大,降低大,降低预测精度,精度,预测功功能失效。能失效。 三、异方差性的检验三、异方差性的检验检验思绪:检验思绪: 由于异方差性就是相由于异方差性就是相对于不同的解于不同的解释变量量观测值,随机,随机误差差项具有不同的方差。那么:具有不同的方差。那么: 检验异方差性,也就是异方差性,也就是检验随机随机误差差项的的方差与解方差与解释变量量观测值之之间的相关性及其相的相关性及其相关的关的“方式。方式。 ( (一一) )图示法示法 既可利用因既可利用因变量量Y与解与解释变量量X的散点的散点图,也可利用残差也可利用残差e2-X的散点的散点图,对随机

14、随机项u的异的异方差作近似的直方差作近似的直观判判别。 1用用X-Y的散点的散点图进展判展判别 看能否存在明看能否存在明显的散点的散点扩展、减少或复展、减少或复杂型型趋势即不在一个固定的即不在一个固定的带型域中型域中看能否构成一斜率看能否构成一斜率为零的直零的直线 二戈德菲尔德二戈德菲尔德- -匡特匡特(Goldfeld-Quandt)(Goldfeld-Quandt)检验检验 G-Q检验以以F检验为根底,适用于大根底,适用于大样本、异方差本、异方差递增增或或递减的情况。减的情况。 G-Q G-Q检验的思想的思想: :先排序先排序, ,将将样本去掉中本去掉中间的的c c个个, ,然后一分然后一

15、分为二,二,对子子样和子和子样分分别作回作回归,然后利用两个子,然后利用两个子样的残差平方和之比构造的残差平方和之比构造统计量量进展异方差展异方差检验。 H: 随随x递增或递减递增或递减 G-Q G-Q检验的步骤:检验的步骤:将将n对样本察看本察看值(Xi, Yi)按察看按察看值Xi的大小排的大小排队将序列中将序列中间的的c=n/4个察看个察看值除去,并将剩下的除去,并将剩下的察看察看值划分划分为较小与小与较大的一大的一样的两个子的两个子样本,本,每个子每个子样样本容量均本容量均为(n-c)/2对每个子每个子样分分别进展展OLS回回归,并,并计算各自的残算各自的残差平方和差平方和 分分别用用R

16、SS1与与RSS2表示解表示解释变量量较小与小与较大大的残差平方和的残差平方和(自在度均自在度均为(n-c)/2-k); 给定定显著性程度著性程度,确定,确定临界界值F(v1,v2), 假假设F F(v1,v2), 那么回那么回绝同方差性假同方差性假设,阐明明存在异方差。存在异方差。 在同方差性假定下,在同方差性假定下,选择如下如下满足足F分布的分布的统计量假量假设检验递增方差增方差 F= = F( k, k ) 假设检验递减方差假设检验递减方差 F= = F( k, k )三戈里瑟三戈里瑟(Gleiser)(Gleiser)检验检验 根本思想根本思想: : 尝试建立建立|ei|ei|关于解关

17、于解释变量量X X的各种的各种幂次方次方程:如:程:如: |ei| = 0 + 1Xi+vi |ei| = 0 + 1Xi+vi |ei| = 0 + 1Xi-1+vi |ei| = 0 + 1Xi-1+vi 等等等等选择关于关于变量量X的不同的函数方式,的不同的函数方式,对方程方程进展估展估计并并进展展显著性著性检验,假,假设存在某一种函数方式,使存在某一种函数方式,使得方程得方程显著成立,那么著成立,那么阐明原模型存在异方差性。明原模型存在异方差性。四四Spearman等级秩相关检验等级秩相关检验 这是一种非参数检验。方法为:这是一种非参数检验。方法为:1. 利用最小二乘法对模型进展回归,

18、计算残差利用最小二乘法对模型进展回归,计算残差 ei及其绝对值及其绝对值|ei|;2. 给出给出X的每个的每个Xi的位次和的位次和|ei|的位次;的位次;3. 计算每个样本点的计算每个样本点的Xi的位次和的位次和|ei|的位次的差的位次的差 di 4. 计算计算Spearman等级秩相关系数:等级秩相关系数:5. 对对Spearman等级秩相关系数进展等级秩相关系数进展显著性检验。检验统计量为显著性检验。检验统计量为 上述上述统计量服从自在度量服从自在度为n2的的t分布。分布。对应 给定定显著性程度的著性程度的临界界值 ,假,假设t ,那么以,那么以为不存在异方差,假不存在异方差,假设t ,那

19、么以,那么以为存在异方差。存在异方差。( (五五). ). 怀特怀特WhiteWhite检验检验 怀特检验不需求排序,且适宜任何方式的异怀特检验不需求排序,且适宜任何方式的异方差。方差。 怀特检验的根本思想与步骤以二元为例:怀特检验的根本思想与步骤以二元为例:然后做如下然后做如下辅助回助回归 可以可以证明,在同方差假明,在同方差假设下:下:(*) R2为(*)的可决系数,的可决系数,h为(*)式解式解释变量的个数,量的个数,表示表示渐近服从某分布。近服从某分布。做如下辅助回归做如下辅助回归留意:留意: 辅助回归仍是检验辅助回归仍是检验 与解释变量能够的与解释变量能够的组合的显著性,因此,辅助回

20、归方程中还可引入组合的显著性,因此,辅助回归方程中还可引入解释变量的更高次方。解释变量的更高次方。 假设存在异方差性,那么阐明确与解释变量假设存在异方差性,那么阐明确与解释变量的某种组合有显著的相关性,这时往往显示出有的某种组合有显著的相关性,这时往往显示出有较高的可决系数以及某一参数的较高的可决系数以及某一参数的t检验值较大。检验值较大。 当然,在多元回归中,由于辅助回归方程中当然,在多元回归中,由于辅助回归方程中能够有太多解释变量,从而使自在度减少,有时能够有太多解释变量,从而使自在度减少,有时可去掉交叉项。可去掉交叉项。四、异方差的消除方法 异方差消除的根本思异方差消除的根本思绪是将原模

21、型加以是将原模型加以“变换,使得,使得“变换后的模型具有同方差性。但是后的模型具有同方差性。但是变换的方式与每个随的方式与每个随机机项方差的真方差的真实值是知是知还是未知有关。是未知有关。一随机一随机项方差方差i2知知 当当i2知或者可以估知或者可以估计出来的情况,可利用广出来的情况,可利用广义的最小二乘法。下面引的最小二乘法。下面引见广广义最小二乘法的另最小二乘法的另一种情形一种情形:加加权最小二乘法最小二乘法Weighted Least Squares, WLS乘以模型的两端,得乘以模型的两端,得以一元线性回归模型为例,变换的方法是用以一元线性回归模型为例,变换的方法是用 令令把它称把它称

22、为变换后的随机后的随机项.由于由于而而 所以所以由此可得由此可得 所以所以中随机项中随机项 满足了同方差性的假定。满足了同方差性的假定。 故可以用常规的故可以用常规的对其进展估计对其进展估计. . 加加权最小二乘法的根本思想:最小二乘法的根本思想: 加加权最小二乘法是最小二乘法是对原模型加原模型加权,本,本质是用方差是用方差i2的平方根的平方根i对原模型原模型进展展变换。使之使之变成一个新的不存在异方差性的模型,成一个新的不存在异方差性的模型,然后采用然后采用OLS估估计其参数。其参数。留意留意: 加加权最小二乘法的思最小二乘法的思绪很很简单,但在,但在详细实际中有关随机中有关随机项方差的信息

23、极少,我方差的信息极少,我们很很难找出真找出真实的随机的随机项方差方差i2 。因此。因此加加权最小二乘法最小二乘法仅是是实际上的存在,上的存在,实践上往往很践上往往很难运用它。所以,当运用它。所以,当i2未知未知或者利用知或者利用知观测数据无法估数据无法估计的情况下,的情况下,必需必需寻求其它的方法。求其它的方法。 二随机二随机项方差未知方差未知从异方差的意从异方差的意义看,异方差就是随机看,异方差就是随机项在解在解释变量取不同数量取不同数值时方差不同。方差不同。这就意味着异方就意味着异方差差i2是解是解释变量量x的函数,的函数,这种函数方式我种函数方式我们可假可假设出来出来 。 例如,假设只

24、与一个解释变量有关,可假设例如,假设只与一个解释变量有关,可假设可以用去除该模型,得可以用去除该模型,得新模型中,存在新模型中,存在 即即满足同方差性,可用足同方差性,可用OLSOLS法估法估计。假假设与与m(1mk)个解个解释变量有关,那么异方差方式量有关,那么异方差方式可写作可写作以遍除原模型,得:以遍除原模型,得:记记可以可以对转换后的模型后的模型OLS运用运用进展参数估展参数估计。 这阐明明转换后的模型具有了同方差性。后的模型具有了同方差性。 假设给定的模型为假设给定的模型为:假定假定1: 此此时用用X去乘以原模型去乘以原模型,可得可得(其中其中, )那么有那么有:这样转换后的模型具有

25、同方差性后的模型具有同方差性 。对转换后的模型运用对转换后的模型运用OLS,OLS,即可求得即可求得 对的对的回归方程回归方程: : 将上式两边同乘,可得原模型的回归方程为:将上式两边同乘,可得原模型的回归方程为: 假定假定2此时用此时用 去除原模型去除原模型, 可得可得 其中其中那么有那么有:对转换后的模型即可运用普通最小二乘法后的模型即可运用普通最小二乘法进展参数展参数估估计可得:可得:所以原模型的回所以原模型的回归方程方程为:留意:留意:(1).实践运用实践运用WLS时,经常用自变量的幂函数的倒数时,经常用自变量的幂函数的倒数 方式方式 作为权数对原模型进展加权,作为权数对原模型进展加权

26、, 但但m终究取何值适宜,需求经过估计。终究取何值适宜,需求经过估计。 (2). 假假设异方差是由省略的解异方差是由省略的解释变量呵斥的,最好的解量呵斥的,最好的解 决方决方 法是在模型中参与省略的解法是在模型中参与省略的解释变量。量。 (3). 对于多元于多元线性回性回归模型,异方差模型,异方差问题同同样存在。用存在。用 哪一个自哪一个自变量构造量构造权数呢?通行的做法是:首先数呢?通行的做法是:首先 用用 OLS估估计 样本回本回归方程,方程,计算出各算出各样本点的本点的绝对 残差;然后分残差;然后分别计算每一个自算每一个自变量与量与绝对残差序列的残差序列的 等等级相关系数;相关系数;选取

27、取 Spearman等等级相关系数大的自相关系数大的自变 量构造量构造权数。数。权数的构造数的构造 方法同一元方法同一元线性回性回归模型。模型。五、案例五、案例储蓄与收入模型蓄与收入模型 例例 表表( (见Eviews)Eviews)是是储蓄与收入的蓄与收入的样本本观测值,试进展异方差性分析展异方差性分析, ,并建立并建立储蓄蓄y y关于收入关于收入x x的的线性回性回归模型。模型。 1根据表中数据,做出根据表中数据,做出X与与Y的散点的散点图。方法。方法为:翻:翻开开Eviews任任务文件。点文件。点击quick,选Graph,点,点击ok;在在对话框中从框中从Graph Type中中选sc

28、atterDiagram,点,点击“ok。散点。散点图如下:如下: 一异方差检验一异方差检验2根据表中数据,做出残差图根据表中数据,做出残差图运转运转Eviews,进展进展OLS估计;点击估计;点击Resids,可得拟合与残差,可得拟合与残差图,选图,选View中的中的Actual,Fitted,Residual Actual,Fitted,Residual Table功能就得到可用来进展残差功能就得到可用来进展残差分析表;利用该结果画出分析表;利用该结果画出X与残差平方的散点图输出结与残差平方的散点图输出结果整理如下:果整理如下: x与残差平方的散点图与残差平方的散点图 从上面两图可以看出,

29、在较高的收入程度上储蓄从上面两图可以看出,在较高的收入程度上储蓄的离散程度增大,阐明随机项能够存在递增型的的离散程度增大,阐明随机项能够存在递增型的异方差。异方差。 进一步的统计检验进一步的统计检验 G-Q检验 将原始数据按排成升序,去掉中将原始数据按排成升序,去掉中间的个的个观测点数据,得两个容量点数据,得两个容量为1 1的子的子样本。本。 对两个子两个子样本分本分别作作OLSOLS回回归,求各自的残差平,求各自的残差平方和方和RSS1RSS1和和RSS2RSS2: 子样本子样本1:189.4) (0.015)R2=0.787 RSS1=144771.5子样本子样本2: (709.8) (0

30、.022)R2=0.152 RSS2=769889.2计算计算F F统计量:统计量: F= RSS2/RSS1=769889.2/144771.5=5.3 F= RSS2/RSS1=769889.2/144771.5=5.3 查表表 给定定=5%,查得得临界界值 F0.05(9,9)=3.18判判别 F F0.05(9,9) 否否认两两组子子样方差一方差一样的假的假设,从而,从而该总体随机体随机项存在存在递增异方差性。增异方差性。 ( (二二) )异方差的处置异方差的处置1. 最优权数确实定最优权数确实定以上检验证明了以上检验证明了y的异方差性的存在。所以需求的异方差性的存在。所以需求用加权最

31、小二乘法估计参数。运用用加权最小二乘法估计参数。运用WLS首先需首先需求估计权数。我们采用自变量幂函数的倒数权求估计权数。我们采用自变量幂函数的倒数权数的方式:数的方式: 利用利用SPSS,可以求得,可以求得幂的最正确取的最正确取值。翻开。翻开SPSS,依次点,依次点击AnalyzeRegressionWeight Estimate,本例,本例经过运运转SPSS得到的取得到的取值为2,即,即权数数为: 相当于对原总体回归模型变换为:相当于对原总体回归模型变换为:从而消除异方差性的影响。从而消除异方差性的影响。 其拟合优度检验、其拟合优度检验、F检验、检验、t检验均高度显著。加权检验均高度显著。

32、加权回归的结果比不加权的回归结果有很大的改良回归的结果比不加权的回归结果有很大的改良 (0.004484) (74.165566) (19.815) (9.985) R2 = 0.93122 F = 392.644532.加权回归加权回归从输出结果看,复原后的加权最小二乘法的估计结果为:从输出结果看,复原后的加权最小二乘法的估计结果为:一、自相关的涵义一、自相关的涵义二、自相关产生的后果二、自相关产生的后果三、自相关检验三、自相关检验四、自相关模型的经济计量方法四、自相关模型的经济计量方法五、案例五、案例第三节第三节 自相关自相关 一、自相关的涵义一、自相关的涵义 假假设对于不同的于不同的样本

33、点,随机本点,随机误差差项之之间不不再是不相关的,而是存在某种相关性,那么再是不相关的,而是存在某种相关性,那么以以为出出现了序列相关性或称存在自相关。了序列相关性或称存在自相关。 对于模型于模型 Yi=0+1X1i+2X2i+kXki+i i=1,2, ,n随机随机项互不相关的根本假互不相关的根本假设表表现为 Cov(i , j)=0 ij, i,j=1,2, ,n或或称为一阶序列相关,或一阶自回归称为一阶序列相关,或一阶自回归.其其中中:被被称称为自自协方方差差系系数数coefficient of autocovariance或或一一阶自自回回归系系数数first-order coeffi

34、cient of autocorrelation i是是满足以下足以下规范的范的OLS假定的随机干假定的随机干扰项:假假设仅存在存在 E(i i+1)0 i=1,2, ,n 一一阶自回自回归往往可写成如下方式:往往可写成如下方式: i=i-1+i -11 由于序列相关性由于序列相关性经常出如今以常出如今以时间序列序列为样本的模型中,本的模型中,因此,本因此,本节将用下将用下标t t代表代表i i。 自相关产生的缘由自相关产生的缘由 一被解释变量的自相关一被解释变量的自相关 二模型省略了自相关的解释变量二模型省略了自相关的解释变量 三随机项本身存在自相关三随机项本身存在自相关四回归模型的数学方式

35、不正确四回归模型的数学方式不正确(五五) 经济变量的惯性作用经济变量的惯性作用. 计量经济学模型一旦出现序列相关性,假计量经济学模型一旦出现序列相关性,假设仍采用设仍采用OLS法估计模型参数,会产生以下法估计模型参数,会产生以下不良后果:不良后果: 二、自相关产生的后果二、自相关产生的后果 1 1、参数估计量非有效、参数估计量非有效 由于,在有效性证明中利用了由于,在有效性证明中利用了 E(UUT)= 2I 即同方差性和不相关性的假定条件。即同方差性和不相关性的假定条件。 而且,在大样本情况下,参数估计量虽然具有而且,在大样本情况下,参数估计量虽然具有一致性,但依然不具有渐近有效性。一致性,但

36、依然不具有渐近有效性。 2、变量的显著性检验失去意义、变量的显著性检验失去意义 在变量的显著性检验中,统计量是建立在变量的显著性检验中,统计量是建立在参数方差正确估计根底之上的,这只需在参数方差正确估计根底之上的,这只需当随机误差项具有同方差性和相互独立性当随机误差项具有同方差性和相互独立性时才干成立。时才干成立。 其他其他检验也是如此。也是如此。3、模型的预测失效区间预测与参数估计量的方差有关,在方差有偏误的情况下,使得预测估计不准确,预测精度降低。所以,当模型出现序列相关性时,它的预测功能失效。 然然后后,经过分分析析这些些“近近似似估估计量量之之间的的相相关关性性,以以判判别随随机机误差

37、差项能能否否具具有有序序列列相关性。相关性。 序列相关性序列相关性检验方法有多种,但根本思方法有多种,但根本思绪一一样: 根本思根本思绪: : 三、自相关的检验三、自相关的检验 一图示法一图示法二杜宾二杜宾- -瓦森瓦森Durbin-WatsonDurbin-Watson检验法检验法 D-W检检 验验 是是 杜杜 宾宾 J.Durbin 和和 瓦瓦 森森 (G.S. Watson)于于1951年年提提出出的的一一种种检检验验序序列列自自相相关关的的方方法法,该方法的假定条件是:该方法的假定条件是:1 1解解释变量量X X非随机;非随机;2 2随机随机误差差项i i为一一阶自回自回归方式:方式:

38、 i=i=i-1+i-1+i i3 3回回归模模型型中中不不应含含有有滞滞后后因因 变量量作作为解解释变量量,即即不不应出出现以下方式:以下方式: Yi= Yi=0+0+1X1i+1X1i+kXki+kXki+Yi-1+Yi-1+i i4 4大大样本本, ,回回归含有截距含有截距项 该统计量的分布与出如今量的分布与出如今给定定样本中的本中的X值有复有复杂的关系,的关系,因此其准确的分布很因此其准确的分布很难得到。得到。 但是,他但是,他们胜利地利地导出了出了临界界值的下限的下限dL和上限和上限dU ,且,且这些上下限只与些上下限只与样本的容量本的容量n和解和解释变量的个数量的个数k有关,而与解

39、有关,而与解释变量量X的取的取值无关。无关。 杜宾和瓦森针对原假设:杜宾和瓦森针对原假设:H0: H0: =0=0, 即不存在一阶自回即不存在一阶自回归,构如下造统计量:归,构如下造统计量: D.W. 统计量统计量:d= 当当D.W.值在值在2左右时,模型不存在一阶自相关。左右时,模型不存在一阶自相关。 证明:明: 展开展开D.W.D.W.统计量:量: (*)假假设存存在在完完全全一一阶正正相相关关,即即=1,那那么么 D.W. 0 完完全全一一阶负相相关关,即即= -1, 那那么么 D.W. 4 完全不相关,完全不相关, 即即=0,那么,那么 D.W.2这里,为一阶自回归模型i=i-1+i的

40、参数估计。 D.W检验步骤检验步骤:1计算算DW值2给定定,由,由n和和k的大小的大小查DW分布表,得分布表,得临界界值dL和和dU3比比较、判、判别 假假设 0D.W.dL 存在正自相关存在正自相关 dLD.W.dU 不能确定不能确定 dU D.W.4dU 无自相关无自相关 4dU D.W.4 dL 不能确定不能确定 4dL D.W.4 存在存在负自相关自相关 0dLdU24-dU4-dL4正相关不能确定无自相关不能确定负相关 假设模型被检验证明存在序列相关性,那么需求分析缘假设模型被检验证明存在序列相关性,那么需求分析缘由由,假设是由省略某些解释变量呵斥的假设是由省略某些解释变量呵斥的,那

41、么应找出省略的那么应找出省略的变量变量,将它包含在模型中将它包含在模型中;假设是由于错误地确定模型的数假设是由于错误地确定模型的数学方式引起学方式引起,那么应该修正其数学方式那么应该修正其数学方式.排除以上缘由后依排除以上缘由后依然存在的自相关可以开展新的方法估计模型。然存在的自相关可以开展新的方法估计模型。 最常用的方法是广最常用的方法是广义最小二乘法最小二乘法GLS: Generalized least squares和广和广义差分法差分法(Generalized Difference)。四、自相关的经济计量方法四、自相关的经济计量方法 1 1、广义差分法、广义差分法 广广义义差差分分法法

42、是是将将原原模模型型变变换换为为满满足足OLS法法的的差分模型,再进展差分模型,再进展OLS估计。估计。假假设原模型原模型为可以将原模型可以将原模型变换为: : 令原模型可原模型可变为: : 其中这种变换叫广义差分变换。变换后的模型称为广这种变换叫广义差分变换。变换后的模型称为广义差分模型。义差分模型。 其中将原回归模型进展广义差分变换得广义差分模型,将原回归模型进展广义差分变换得广义差分模型,对广义差分模型运用普通最小二乘法,这种方法称对广义差分模型运用普通最小二乘法,这种方法称为广义差分法。为广义差分法。 可取可取补全数据补全数据时,上式变为:即即其中其中该种变换叫做一阶差分变换,变换后的

43、模型叫该种变换叫做一阶差分变换,变换后的模型叫做一阶差分模型。这种模型的一个重要特征是做一阶差分模型。这种模型的一个重要特征是没有常数项。易得:没有常数项。易得: 随机误差项相关系数的估计随机误差项相关系数的估计运用广义差分法,必需知随机误差项的相关系数。实践上,人们并不知道它们的详细数值,所以必需首先对它们进展估计。常用的估计方法有: 科克科克伦-奥科特奥科特Cochrane-Orcutt迭代法。迭代法。 杜杜宾durbin两步法两步法2、杜宾、杜宾durbin两步法两步法该方法仍是先估计,再对差分模型进展估计 第一步,第一步,变换差分模型差分模型为以下方式以下方式进展OLS估计,得Yjj=

44、t-1)前的系数估计值令那么(2).用估计值对原模型进展差分变换对差分模型运用OLS方法,可得、的估计值、从而还可以用其它的方法求的估计值,如:存在两个问题。其一,所得参数估计值的准确度依赖于存在两个问题。其一,所得参数估计值的准确度依赖于的准确度;其二,差分模型的随机项有能够仍存在自的准确度;其二,差分模型的随机项有能够仍存在自相关。相关。、科克伦-奥科特迭代法。以一元线性模型为例:首先,采用OLS法估计原模型Yi=0+1Xi+i得到的的“近似估计值,并以之作为观测值运用OLS法估计下式求得的估计值,记作:利用进展广义差分变换得广义差分模型对原模型其中其中对模型运用普通最小二乘法进展估计,得

45、到对模型运用普通最小二乘法进展估计,得到 参数的估参数的估计值并对模型中的随机项计值并对模型中的随机项 能否存在自相关进展检验。能否存在自相关进展检验。假设检验得出随机项无自相关,迭代就此终了。假设检验得出随机项无自相关,迭代就此终了。 否那么,就反复前面的步骤,将模型的估计值复原为原否那么,就反复前面的步骤,将模型的估计值复原为原模型的参数估计值模型的参数估计值 ,由此计算,由此计算 的第二次估计值的第二次估计值 ,然后根据,计算然后根据,计算 的第二次估计值,记作的第二次估计值,记作 关于迭代的次数,可根据详细的问题来定。关于迭代的次数,可根据详细的问题来定。 普普通通是是事事先先给给出出

46、一一个个精精度度,当当相相邻邻两两次次 1, 2, , L的的估估计计值值之之差差小小于于这这一一精精度度时,迭代终止。时,迭代终止。 实实际际中中,有有时时只只需需迭迭代代两两次次,就就可可得得到到较较称称心心的的结结果果。两两次次迭迭代代过过程程也也被被称称为为科科克伦克伦-奥科特两步法。奥科特两步法。利用利用 对原模型再进展差分变换对原模型再进展差分变换 ,这就是第二次,这就是第二次迭代同样可以进展第三次、第四次迭代,直至差分迭代同样可以进展第三次、第四次迭代,直至差分模型中的随机项消除自相关性,就停顿迭代过程。模型中的随机项消除自相关性,就停顿迭代过程。 五、案例五、案例 某国进口贸易

47、额某国进口贸易额IM与国民消费总值与国民消费总值GDP的数的数据见表。试建立进口贸易额据见表。试建立进口贸易额IM与国民消费总值与国民消费总值GDP的线性回归模型。的线性回归模型。资料见下页资料见下页 进口贸易额与国民消费总值的数据进口贸易额与国民消费总值的数据序号序号 IM(y)GDP (x)序号序号IM (y)GDP (x)137482177711566928134237112241812562829091340102230813573629450440042331914596430705541512418015650132372645692489316654933152745822531

48、0176705337648469725799187104344119475325886197609354291050622686820810036200单位:百万英镑单位:百万英镑运用最小二乘法得到如下回归方程:运用最小二乘法得到如下回归方程: s(b)=248.65 (0.087) R2 = 0.983 d =0.9337给定定= 0.05,查显著性程度著性程度为0.05,观测值个个数数为20及解及解释变量个数量个数为1的的D-W分布表,得到分布表,得到临界界值dL=1.20 dU=1.41由于由于 ddL,所以随机项,所以随机项u存在一阶正自相关存在一阶正自相关自相关的自相关的处置置 杜杜

49、宾二步法二步法 估估计一一阶自相关系数自相关系数作作et关于关于et-1的线性回归,得到的线性回归,得到可得可得 = 0.53令令 =0.53,做以下,做以下变换对对 关于关于 的线性模型做最小二乘估计,得的线性模型做最小二乘估计,得R2=0.949 d=1.87由于由于d接近接近2,已消除自相关,故得,已消除自相关,故得0 、 1的估的估计值分分别为: b1=0.296 b0=9.36/(1 0.53)= 2966.7由此可得要估计的原回归方程为由此可得要估计的原回归方程为 第四节第四节 随机解释变量问题随机解释变量问题一、估计量的渐近性质一、估计量的渐近性质二、随机解释变量模型估计特性二、

50、随机解释变量模型估计特性 三、随机解释变量模型的经济计量方法三、随机解释变量模型的经济计量方法四、案例四、案例一、估计量的渐近性质线性、无偏性和有效性是评价一个估计量优劣的线性、无偏性和有效性是评价一个估计量优劣的规范。在有的情况下,小样本的估计量不具有某规范。在有的情况下,小样本的估计量不具有某种统计特性,但随着样本容量的增大,估计量逐种统计特性,但随着样本容量的增大,估计量逐渐有了这种统计性质,此时称之为估计量的渐近渐有了这种统计性质,此时称之为估计量的渐近统计性质。统计性质。 1. 渐近无偏性渐近无偏性2. 渐近一致性渐近一致性为样本容量为为样本容量为n时参数时参数 的估计量的估计量.

51、下面下面,记记 1. 渐近无偏性渐近无偏性假设满足假设满足那么称那么称 为为 的渐近无偏估计量。的渐近无偏估计量。随着样本容量的逐渐增大,估计量与真实值的系统随着样本容量的逐渐增大,估计量与真实值的系统偏向越来越小,逐渐趋于偏向越来越小,逐渐趋于0。 即即:经过添加样本容量,经过添加样本容量,可以改善参数估计的精度。可以改善参数估计的精度。2. 渐近一致性渐近一致性假设满足简记为那么称为的一致估计量。表示概率极限表示概率极限 可以证明可以证明 为为 的的 一致估计量,当且仅当一致估计量,当且仅当 一致估计量具有渐近无偏性的概率为一致估计量具有渐近无偏性的概率为1,且在真实值,且在真实值附近离散

52、的程度随样本容量的增大逐渐趋于附近离散的程度随样本容量的增大逐渐趋于0的概率为的概率为1。 在大样本的条件下,一致估计量具有很高的精度在大样本的条件下,一致估计量具有很高的精度 二、随机解释变量模型估计特性二、随机解释变量模型估计特性以一元线性回归模型为例以一元线性回归模型为例 阐明。设给定的模型为阐明。设给定的模型为 采用离差方式即为采用离差方式即为 式中,式中, ,不论自变量能否是随机变量,对上式运用不论自变量能否是随机变量,对上式运用OLS,参数的估计量都是参数的估计量都是我们分以下三种情况进展讨论我们分以下三种情况进展讨论 1. x 是非随机变量,是非随机变量,x与与u自然不相关自然不

53、相关最小二乘估计量是无偏的。最小二乘估计量是无偏的。2. x是随机变量,但是随机变量,但x与与u不相关不相关 最小二乘估计量依然是无偏的。最小二乘估计量依然是无偏的。3. x是随机变量,且是随机变量,且u与与x线性相关线性相关 最小二乘估计量是有偏的。这时,又分两种情况:最小二乘估计量是有偏的。这时,又分两种情况:1在大样本下,假设在大样本下,假设x与与u渐近不相关,渐近不相关, 对1估估计式两式两边取概率极限取概率极限,有有阐明最小二乘估计量具有一致性。也就是说,假设阐明最小二乘估计量具有一致性。也就是说,假设 x是随机变量,且是随机变量,且x与与u不独立,虽然小样本的无偏不独立,虽然小样本

54、的无偏性得不到满足,但在样本容量添加时,性得不到满足,但在样本容量添加时,OLSE会逐会逐渐逼近真实的总体参数,即在样本足够大时,渐逼近真实的总体参数,即在样本足够大时,OLSE依然是有意义的。依然是有意义的。2 x与与u不存在渐近不相关关系,即使在大样本条件下,不存在渐近不相关关系,即使在大样本条件下,依然存在依然存在 由此可以看出,由此可以看出,b1是是1的非一致估的非一致估计量。量。这时OLS失效,必需引失效,必需引进其他方法估其他方法估计参数和参数和进展展统计推推论推推论。 模型中出现随机解释变量且与随机误差项相模型中出现随机解释变量且与随机误差项相关时,关时,OLS估计量是有偏的。估

55、计量是有偏的。 假设随机解释变量与随机误差项异期相关,那假设随机解释变量与随机误差项异期相关,那么可以经过增大样本容量的方法来得到一致的估么可以经过增大样本容量的方法来得到一致的估计量;计量; 但假设是同期相关,即使增大样本容量也无济但假设是同期相关,即使增大样本容量也无济于事。这时,最常用的估计方法是工具变量法于事。这时,最常用的估计方法是工具变量法Instrument variables。 三、随机解释变量模型的经济计量方法三、随机解释变量模型的经济计量方法 1 1、工具变量的选取、工具变量的选取 工具变量:在模型估计过程中被作为工具运工具变量:在模型估计过程中被作为工具运用,以替代模型中

56、与随机误差项相关的随机解用,以替代模型中与随机误差项相关的随机解释变量。释变量。 选择为工具变量的变量必需满足以下条件:选择为工具变量的变量必需满足以下条件:1与所替代的随机解释变量高度相关;2与随机误差项不相关;3与模型中其它解释变量不相关,以防止出现多重共线性。 2 2、工具变量的运用、工具变量的运用以一元回归模型的离差方式为例阐明如下:用OLS估计模型,相当于用x*i去乘模型两边、对i求和、再略去x*iui项后得到正规方程: (*)解得 假设选择Z为X的工具变量,那么在上述估计过程可改为:利用E(ziui)=0,即这种求模型参数估计量的方法称为工具变量法(instrumentalvari

57、ablemethod),相应的估计量称为工具变量法估计量instrumentalvariable(IV)estimator。可得 1、在小样本下,工具变量法估计量仍是有偏的。 留意: 2、工具、工具变量并没有替代模型中的解量并没有替代模型中的解释变量,只量,只是在估是在估计过程中作程中作为“工具被运用。工具被运用。 上述工具变量法估计过程可等价地分解成下面的两步OLS回归: 第一步,用OLS法进展X关于工具变量Z的回归: 容易验证仍有: 因此,工具变量法仍是Y对X的回归,而不是对Z的回归。 3、假、假设模型中有两个以上的随机解模型中有两个以上的随机解释变量与随机量与随机误差差项相关,就必需找到

58、两个以上的工具相关,就必需找到两个以上的工具变量。但是,量。但是,一旦工具一旦工具变量量选定,它定,它们在估在估计过程被运用的次序不程被运用的次序不影响估影响估计结果果 4 4、OLSOLS可以看作工具变量法的一种特殊情况。可以看作工具变量法的一种特殊情况。 、要找到与随机扰动项不相关而又与随机解释变量相关的工具变量并不是一件很容易的事 可以用Xt-1作为原解释变量Xt的工具变量。 四、案例四、案例下页表中x代表国内消费总值,y代表消费,z代表投资。用表中所提供的某地的三项目的的资料阐明工具变量的运用方法。 国内消费总值、消费、投资数据 年份xyz年份xyZ17164.34694.52468.

59、6925863.615952.19636.028792.15773.03386.01034500.620212.112998.0310132.86542.03846.01147110.927216.219260.6411784.07451.24322.01258510.533635.023877.0514704.09360.15495.01368330.440003.926867.2616466.010556.56095.01474894.343579.428457.6718319.515.26444.01579853.346405.930396.0821280.413145.9515.0单位

60、:亿元设消费y与国内消费总值x之间具有线性关系,可建立如下模型:由于国内消费总值x与随机项u相关,而投资z与随机项u无关,与国内消费总值x高度相关,故可用z作为国内消费总值x的工具变量。参数估计如下:=0.568051876.010088那么样本回归模型为:一、多重共线性的涵义一、多重共线性的涵义二、多重共线性引起的后果二、多重共线性引起的后果三、多重共线性的检验三、多重共线性的检验四、消除多重共线性的方法四、消除多重共线性的方法五、案例五、案例第五节第五节 多重共线性多重共线性 一、多重共线性的涵义一、多重共线性的涵义对于模型Yi=0+1X1i+2X2i+kXki+uii=1,2,n其根本假

61、设之一是解释变量是相互独立的。假设某两个或多个解释变量之间出现了相关性,那么称为多重共线性(Multicollinearity)。 假假设存在存在 c1X1i+c2X2i+ck Xki =0 i=1,2,n 其其中中: ci不不全全为0,那那么么称称为解解释变量量间存存在在完全共完全共线性性perfect multicollinearity。 假假设存在存在 c1X1i+c2X2i+ckXki+vi=0 i=1,2,n 其其中中ci不不全全为0,vi为随随机机误差差项,那那么么称称为 近近似似共共线性性approximate multicollinearity或或存存在在不不完完全全线性相关、

62、接近性相关、接近线性关系。性关系。 在矩阵表示的线性回归模型在矩阵表示的线性回归模型 Y=X +u中,完全共线性指:中,完全共线性指: rank(X)k+1,即,即中,至少有一列向量可由其他列向量不包括第一列中,至少有一列向量可由其他列向量不包括第一列线性表示。性表示。 如:如:X2= X1,那么,那么X2对Y的作用可由的作用可由X1替代。替代。留意:完全共线性的情况并不多见,普通出现的是在一定程度上的共线性,即近似共线性。综上所述,多重共线性就是指解释变量之间综上所述,多重共线性就是指解释变量之间存在完全的线性关系或接近的线性关系存在完全的线性关系或接近的线性关系. 多重共线性产生的缘由多重

63、共线性产生的缘由 普普通通地地,产产生生多多重重共共线线性性的的主主要要缘缘由由有有以以下下三三个方面:个方面: 1经济变量相关的共同趋势经济变量相关的共同趋势 时时间间序序列列样样本本:经经济济昌昌盛盛时时期期,各各根根本本经经济济变变量量收收入入、消消费费、投投资资、价价钱钱都都趋趋于于增增长长;衰衰退时期,又同时趋于下降。退时期,又同时趋于下降。 横横截截面面数数据据:消消费费函函数数中中,资资本本投投入入与与劳劳动动力力投投入入往往往往出出现现高高度度相相关关情情况况,大大企企业业二二者者都都大大,小企业都小。小企业都小。多重共线性是实践经济景象中一种普遍存在的景象多重共线性是实践经济

64、景象中一种普遍存在的景象存在的缘由主要是经济活动中变量之间复杂的相互联络存在的缘由主要是经济活动中变量之间复杂的相互联络 2 2滞后变量的引入滞后变量的引入 在在经济计量模型中,往往需求引入滞量模型中,往往需求引入滞后后经济变量来反映真量来反映真实的的经济关系。关系。 例如,消例如,消费=f(当期收入当期收入, 前期收入前期收入 显然,两期收入然,两期收入间有有较强的的线性相关性。性相关性。 3样本资料的限制普通普通阅历: 时间序列数据序列数据样本:本:简单线性模型,往往存性模型,往往存在多重共在多重共线性。性。 截面数据截面数据样本:本:问题不那么不那么严重,但多重共重,但多重共线性依然是存

65、在的。性依然是存在的。 由于完全符合由于完全符合实际模型所要求的模型所要求的样本数据本数据较难搜集,特定搜集,特定样本能本能够存在某种程度的多重共存在某种程度的多重共线性性 二、多重共线性的后果二、多重共线性的后果 1 1、完全共、完全共线性下参数估性下参数估计量量(OLSE)(OLSE)不不确定确定假假设存在完全共存在完全共线性,那么性,那么(XTX)-1不存在,无法不存在,无法得到参数的估得到参数的估计量。量。的OLS估计量为:例:对二元回归模型例:对二元回归模型假假设两个解两个解释变量完全相关,如量完全相关,如x2= x1,那,那么么这时,只能确定,只能确定综合参数合参数1+2的估的估计

66、值. 2 2、近似共线性下、近似共线性下OLSOLS估计值不准确,也估计值不准确,也不稳定不稳定 由由于于|XTX|0,引引起起(XTX)-1主主对角角线元元素素较大大,使使参参数数估估计值的方差增大,的方差增大,OLS参数估参数估计量非有效。量非有效。近似共线性下,可以得到近似共线性下,可以得到OLS参数估计量,参数估计量, 但但参数估计量方差的表达式为参数估计量方差的表达式为 、变量的显著性检验与预测失去意义、变量的显著性检验与预测失去意义存在多重共存在多重共线性性时参数估参数估计值的方差与的方差与规范差范差变大大容易使容易使经过样本本计算的算的t值小于小于临界界值, 误导作出参数作出参数

67、为0的推断的推断能能够将重要的解将重要的解释变量排除在模型之外量排除在模型之外 留意:留意: 除非是完全共除非是完全共线性,多重共性,多重共线性并不意味着任性并不意味着任何根本假何根本假设的的违背;背; 因此,即使出因此,即使出现较高程度的高程度的多重共多重共线性,性,OLS估估计量仍具有量仍具有线性性等良好的性性等良好的统计性性质。 问题在于,即使在于,即使OLS法仍是最好的估法仍是最好的估计方法,方法,它却不是它却不是“完美的,尤其是在完美的,尤其是在统计推断上无法推断上无法给出真正有用的信息。出真正有用的信息。 变大的方差容易使区大的方差容易使区间预测的的“区区间变大,使大,使预测失去意

68、失去意义。4.难以区分每个解释变量的单独影响难以区分每个解释变量的单独影响多重共线性检验的义务是:1检验多重共线性能否存在;2估计多重共线性的范围,即判别哪些变量之间存在共线性。 多重共多重共线性表性表现为解解释变量之量之间具有相关关系,具有相关关系,所以用于多重共所以用于多重共线性的性的检验方法主要是方法主要是统计方法。方法。 三、多重共线性的检验三、多重共线性的检验 一直观判别法一直观判别法 1. 散点散点图法。法。对含有两个解含有两个解释变量的模型,利量的模型,利用解用解释变量量样本本观测值的散点的散点图来来调查二者能否二者能否存在存在显著的著的线性关系。性关系。 2. 相关系数法。相关

69、系数法。计算解算解释变量之量之间的的简单相关相关系数,假系数,假设两个解两个解释变量之量之间的相关系数接近于的相关系数接近于1,那么可以以,那么可以以为模型存在多重共模型存在多重共线性。性。 3. “经典判典判别法。法。 多重共多重共线性的性的“经典特典特征是征是R2较高,但参数高,但参数t检验值显著的不多,假著的不多,假设一个回一个回归分析分析结果中存在果中存在这一特征,那么一特征,那么应思索思索其能否存在多重共其能否存在多重共线性的性的问题。留意:前两种方法只适用于两个自留意:前两种方法只适用于两个自变量的情况量的情况二自变量之间的复决议系数和方差扩展因子二自变量之间的复决议系数和方差扩展

70、因子 设解解释变量量为k个,即个,即x1,x2, , xk。我。我们分分别以其中的一个以其中的一个对其它一切的解其它一切的解释变量量进展回展回归,得得 k个回个回归方程方程 对每个回每个回归方程求其决方程求其决议系数分系数分别为 在在这些决些决议系数中系数中寻其最大而且接近于其最大而且接近于1者,比者,比如如说 Rj2最大,那么可以断定解最大,那么可以断定解释变量量xj 与其它与其它解解释变量中的一个或多个相关程度高,因此就使量中的一个或多个相关程度高,因此就使得回得回归模型出模型出现高度多重共高度多重共线性。性。 计量经济学中在检验多重共线性时,往往称计量经济学中在检验多重共线性时,往往称1

71、-Rj2为自变量为自变量xj的容忍度的容忍度Tolerance,其倒数,其倒数为方差扩展因子为方差扩展因子Variance Inflation Factor,简记简记为为VIF,即,即 阅历阐明,当明,当VIFj10时,自,自变量量xj与其它自与其它自变量之量之间的多重共的多重共线性就非常大了,以致于足以影性就非常大了,以致于足以影响到响到OLSE。 例二元回归模型例二元回归模型 OLSE的方差的方差 为:为:x1与与x2的的样本相关系数本相关系数 :所以所以同理同理可见,一个自变量与其它自变量的复决议系数越大,可见,一个自变量与其它自变量的复决议系数越大,即多重共线性越严重,会呵斥回归系数的

72、即多重共线性越严重,会呵斥回归系数的OLSEOLSE的方的方差越大差越大 . .所以称所以称为“方差方差扩展因子展因子,它可以用来反映多重共它可以用来反映多重共线性的性的严重程度。重程度。 详细可进一步对上述回归方程作详细可进一步对上述回归方程作F检验:检验:式中:式中:Rj2为第第j个解个解释变量量对其他解其他解释变量的回量的回归方程方程的决的决议系数系数 构造如下构造如下F统计量量 在模型中排除某一个解在模型中排除某一个解释变量量Xj,估,估计模型;模型; 假假设拟合合优度与包含度与包含Xj时非常接近,非常接近,那么那么阐明明Xj与其它解与其它解释变量之量之间存在共存在共线性。性。 另一等

73、价的检验是另一等价的检验是: 假设存在较强的共线性,那么假设存在较强的共线性,那么Rj2较大且接近较大且接近于于1,这时,这时1- Rj2 较小,从而较小,从而Fj的值较大。的值较大。 因此,给定显著性程度因此,给定显著性程度 ,计算,计算F值,并与相值,并与相应的临界值比较,来断定能否存在相关性。应的临界值比较,来断定能否存在相关性。三利用不包括某一解释变量所构成的回归方三利用不包括某一解释变量所构成的回归方 程之决议系数程之决议系数设多元线性回归模型为以下函数方式:设多元线性回归模型为以下函数方式: 设其样本决议系数为设其样本决议系数为R2。假定依次缺一个解释变。假定依次缺一个解释变量进展

74、回归,那么可得到量进展回归,那么可得到k个回归方程个回归方程 。对应的样。对应的样本决议系数分别为本决议系数分别为 :其中其中Rj2为短少解释变量为短少解释变量xj 的回归方程之决议系的回归方程之决议系数数 在这些决议系数中选取一个最大者比如说在这些决议系数中选取一个最大者比如说Rj2 ,那,那么么Rj2与与R2的差为最小,假设解释变量的差为最小,假设解释变量xj从模型中去从模型中去掉,对样本决议系数的影响不大,由此阐明了解释变掉,对样本决议系数的影响不大,由此阐明了解释变量量xj对因变量的解释才干已由其它解释变量替代了,对因变量的解释才干已由其它解释变量替代了,从而阐明从而阐明xj能够是其它

75、解释变量的线性组合,因此可能够是其它解释变量的线性组合,因此可以断定解释变量中包含以断定解释变量中包含xj引起了多重共线性。引起了多重共线性。四法勒四法勒格格劳伯伯FarrarGlauber检验FarrarGlauber提出的提出的检验是三种是三种检验的的结合。合。第一种第一种检验是是 检验,它,它检验多元回多元回归模型中一模型中一切解切解释变量之量之间存在共存在共线性及共性及共线性的程度。第性的程度。第二种二种检验是是F检验,用来确定哪些解,用来确定哪些解释变量是多重量是多重共共线的。第三种的。第三种检验是是t检验,用来找出呵斥解,用来找出呵斥解释变量多重共量多重共线性性缘由的是哪些由的是哪

76、些变量。量。 四、消除多重共线性的方法四、消除多重共线性的方法 模型中存在多重共线性,是不是一定不好呢?模型中存在多重共线性,是不是一定不好呢?这要视模型的详细用途而定。假设模型只是用来这要视模型的详细用途而定。假设模型只是用来进展预测,只需多重样本决议系数进展预测,只需多重样本决议系数R2, 足足够大即可,无需消除多重共线性。但假设模型是够大即可,无需消除多重共线性。但假设模型是用来进展构造分析和政策评价,由于多重共线性用来进展构造分析和政策评价,由于多重共线性影响到每个自变量系数估计的正确性和有效性,影响到每个自变量系数估计的正确性和有效性,所以应设法消除多重共线性的影响,确保模型的所以应

77、设法消除多重共线性的影响,确保模型的可用性。可用性。 一添加样本观测值一添加样本观测值 假假设多重共多重共线性是由性是由样本引起的例如丈量本引起的例如丈量误差或差或偶偶尔的的样本,但解本,但解释变量的量的总体不存在多重共体不存在多重共线性,性,那么可以那么可以经过搜集更多的搜集更多的观测值添加添加样本容量,防止或本容量,防止或减弱多重共减弱多重共线性。性。对于于时间序列序列资料就是增大料就是增大观测次数,次数,对于截面数据于截面数据资料就是添加料就是添加观测对象,或者把象,或者把时间序列序列资料与截面数据料与截面数据资料料结合起来运用。当解合起来运用。当解释变量量总体存体存在多重共在多重共线性

78、性时,添加,添加样本容量也无助于减本容量也无助于减轻多重共多重共线的程度。的程度。 以二元线性模型为例可以看出.二删去不重要的解释变量二删去不重要的解释变量对待待严重的多重共重的多重共线性性问题,一个最,一个最简单的的处理理方法就是方法就是删去那些去那些产生多重共生多重共线性、性、对因因变量影量影响不大且人响不大且人们以以为不重要的解不重要的解释变量,使模型中量,使模型中剩下那些剩下那些对因因变量起重要作用的解量起重要作用的解释变量,然后量,然后对仅包含重要解包含重要解释变量的模型运用普通最小二乘量的模型运用普通最小二乘法。但法。但应留意留意:由于把由于把删去的解去的解释变量量对因因变量量的影

79、响的影响归入随机入随机项中,有能中,有能够使随机使随机项不不满足零足零均均值的假的假设,这时所得的参数估所得的参数估计值能能够是有偏是有偏的,即的,即产生确定性偏倚。生确定性偏倚。三利用三利用“先先验信息信息 先验信息既包括从经济实际也包括从实践统计先验信息既包括从经济实际也包括从实践统计资料中获得的解释变量之间关系的信息。假设我资料中获得的解释变量之间关系的信息。假设我们研讨的回归模型存在多重共线性,而线性相关们研讨的回归模型存在多重共线性,而线性相关的解释变量之间的关系可由事前信息得到。那么的解释变量之间的关系可由事前信息得到。那么只需把事前知道的关系包含进回归模型中,多重只需把事前知道的

80、关系包含进回归模型中,多重共线性就会消逝。共线性就会消逝。举例例1 柯布柯布道格拉斯消道格拉斯消费函数函数 其中,其中,y为产出,为产出,K为资本,为资本,L为劳动力,为劳动力,A、将该模型转化为对数方式将该模型转化为对数方式资金和劳动力之间是高度相关的,所以资金和劳动力之间是高度相关的,所以lnK、lnL之之间也是高度相关的,对数模型存在着多重共线性间也是高度相关的,对数模型存在着多重共线性 先验信息先验信息根据西方根据西方经济实际,普通假,普通假设规模模报酬不酬不变,即,即 +=1 、 为为参数参数利用利用+=1将将对数模型数模型转化化为:式中,式中,y/L为人均产出,为人均产出,K/L为

81、人均资本量。上为人均资本量。上式即为人均单位产出对人均资本量的一元回归模式即为人均单位产出对人均资本量的一元回归模型,多元回归存在的多重共线性就被消除了。型,多元回归存在的多重共线性就被消除了。举例消费函数举例消费函数 设消费函数为:设消费函数为:式中,式中,y 为消费指出,为消费指出, x1为收入,为收入,x2 为财富为财富从收入与财富的关系来看,是高度相关的从收入与财富的关系来看,是高度相关的 先验信息根据大量的根据大量的统计数据可以数据可以总结出,出,2大大约是是1的的 2/3利用此信息将原模型化为:利用此信息将原模型化为:令令上式即化为:上式即化为:就变为一元回归模型,多重共线性就消除

82、了。就变为一元回归模型,多重共线性就消除了。四变换模型的方式四变换模型的方式 有时作为解释变量的某些经济变量之间出现了有时作为解释变量的某些经济变量之间出现了高度相关,但当我们的研讨目的是为了预测,并高度相关,但当我们的研讨目的是为了预测,并不需求区分这些相关的解释变量单独对因变量的不需求区分这些相关的解释变量单独对因变量的影响时,我们可以根据问题的需求对原模型加以影响时,我们可以根据问题的需求对原模型加以变形,使新的模型不再出现多重共线性。变形,使新的模型不再出现多重共线性。 例如,某产品的销售量例如,某产品的销售量y取决于其出厂价钱取决于其出厂价钱x1、市场价钱市场价钱x2和市场总供应量和

83、市场总供应量x3,设定模型为,设定模型为: 通常通常 x1 、 x2 、 x3 是高度相关的,假设研讨是高度相关的,假设研讨的目的主要是为了预测某厂该产品销售量,那么的目的主要是为了预测某厂该产品销售量,那么可以用相对价钱可以用相对价钱x1/x2 替代替代x1 、 x2 对对y的影响,的影响, 采用采用 ln(x1/x2)为解释变量,建立如下对数回归模为解释变量,建立如下对数回归模型型:从而抑制了从而抑制了x1与与x2的相关性。的相关性。五逐渐回归法五逐渐回归法 首先计算被解释变量对每一个解释变量的回归首先计算被解释变量对每一个解释变量的回归方程,这些回归方程叫做根本回归方程。对每一方程,这些

84、回归方程叫做根本回归方程。对每一个根本回归方程进展统计检验,并根据经济实际个根本回归方程进展统计检验,并根据经济实际分析这些回归方程,从中选出最适宜的根本回归分析这些回归方程,从中选出最适宜的根本回归方程,然后再逐一添加其它的解释变量,重新再方程,然后再逐一添加其它的解释变量,重新再作回归。根据这个新加的解释变量的边沿奉献作回归。根据这个新加的解释变量的边沿奉献样本决议系数的添加量和规范差,并调查对每样本决议系数的添加量和规范差,并调查对每个回归系数的影响,作如下的分析判别:个回归系数的影响,作如下的分析判别: 第一,假设新加进的解释变量改良了第一,假设新加进的解释变量改良了R2,并且,并且其

85、它回归系数在统计上仍是显著的,那么,就可其它回归系数在统计上仍是显著的,那么,就可以以为新加进去的解释变量是有用的,作为模型以以为新加进去的解释变量是有用的,作为模型中的解释变量予以保管。中的解释变量予以保管。 第三、假设新加进的解释变量不仅改良了第三、假设新加进的解释变量不仅改良了R2,并且主要是显著地影响了回归系数的符号或数值,并且主要是显著地影响了回归系数的符号或数值,致使某些回归系数到达不能接受的地步,那么可致使某些回归系数到达不能接受的地步,那么可断言产生了严重的多重共线性。断言产生了严重的多重共线性。 第二,假设加进去的解释变量未能改良第二,假设加进去的解释变量未能改良R2,对,对

86、其它回归系数也没有影响,那么不作为解释变量。其它回归系数也没有影响,那么不作为解释变量。五、案例资料为消费支出、收入、财富的假设资料样本点序号消费支出y收入x1财富x2170808102651001009390120127349514014255110160163361151801876712020020528140220220191552402435101502602686单位:美圆线性模型设定为:运转Eviews,部分输出结果如下:DependentVariable:YMethod:LeastSquaresDate:10/18/08Time:16:45Sample:110Includedo

87、bservations:10VariableCoefficient Std.Errort-StatisticProb.C24.616066.8706823.5827690.0089X10.6911750.8171780.8458070.4256X2-0.0179100.080293-0.2230630.8299R-squared0.962329Meandependentvar111.0000AdjustedR-squared0.951566S.D.dependentvar31.42893S.E.ofregression6.916773Akaikeinfocriterion6.949101Sum

88、squaredresid334.892Schwarzcriterion7.039876Loglikelihood-31.74550F-statistic89.41048Durbin-Watsonstat2.765261Prob(F-statistic)0.000010DependentVariable:X2Method:LeastSquaresDate:10/18/08Time:16:59Sample:110Includedobservations:10Variable CoefficientStd.Errort-StatisticProb.C9.01818230.085020.2997570

89、.7720X110.166360.16765760.637780.0000R-squared0.997829Meandependentvar1737.300AdjustedR-squared0.997558S.D.dependentvar616.2732S.E.ofregression30.45645Akaikeinfocriterion9.847329Sumsquaredresid7420.764Schwarzcriterion9.907846Loglikelihood-47.23665F-statistic3676.941Durbin-Watsonstat2.000049Prob(F-st

90、atistic)0.000000回归分析结果整理如下:回归分析结果整理如下:(6.752)(0.823)(0.081)t=(3.669)(1.144)(-0.526)R2=0.964=0.953F=92.402从输出结果看,收入和财富一同解释了消费支出从输出结果看,收入和财富一同解释了消费支出变异的约变异的约96%。检验是经过的,然而没有一个。检验是经过的,然而没有一个斜率系数检验是显著的,且财富变量的斜率系数斜率系数检验是显著的,且财富变量的斜率系数带有错误的符号。这阐明所建立的回归模型明显带有错误的符号。这阐明所建立的回归模型明显具有多重共线性。具有多重共线性。 与此相呼应,与此相呼应,x

91、1和和x2的容忍度只需的容忍度只需0.02约数,约数,方差扩展因子方差扩展因子VIF那么高达那么高达482.128,远远大于,远远大于10,所以一定存在多重共线性。,所以一定存在多重共线性。 在极端多重共线性的情况下,去掉一个高度共在极端多重共线性的情况下,去掉一个高度共线性的变量会使另一个变量变得统计上显著。这阐线性的变量会使另一个变量变得统计上显著。这阐明,处理本例中自变量之间多重共线性的一个方法,明,处理本例中自变量之间多重共线性的一个方法,可以采用删除其中一个变量,用剩下的一个变量与可以采用删除其中一个变量,用剩下的一个变量与y进展回归的方法。当然,也可以将两个自变量合进展回归的方法。当然,也可以将两个自变量合成一个新的变量的方法消除多重共线性。成一个新的变量的方法消除多重共线性。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号