完整的计量经济学计量经济学课件第五章线性回归的

上传人:cn****1 文档编号:569492653 上传时间:2024-07-29 格式:PPT 页数:62 大小:348.50KB
返回 下载 相关 举报
完整的计量经济学计量经济学课件第五章线性回归的_第1页
第1页 / 共62页
完整的计量经济学计量经济学课件第五章线性回归的_第2页
第2页 / 共62页
完整的计量经济学计量经济学课件第五章线性回归的_第3页
第3页 / 共62页
完整的计量经济学计量经济学课件第五章线性回归的_第4页
第4页 / 共62页
完整的计量经济学计量经济学课件第五章线性回归的_第5页
第5页 / 共62页
点击查看更多>>
资源描述

《完整的计量经济学计量经济学课件第五章线性回归的》由会员分享,可在线阅读,更多相关《完整的计量经济学计量经济学课件第五章线性回归的(62页珍藏版)》请在金锄头文库上搜索。

1、第五章第五章 线线性回性回归归的定式偏差的定式偏差.线线性回性回归归的定式偏差的定式偏差本章本章讨论变讨论变量关系非量关系非线线性、存在异常性、存在异常值值、规规律性律性扰动扰动和解和解释变释变量缺落等量缺落等导导致的致的线线性性回回归归模型前两条假模型前两条假设设不成立的定式偏差,不成立的定式偏差,包括它包括它们对线们对线性回性回归归分析的影响、判断和分析的影响、判断和处处理的方法等。理的方法等。.线线性回性回归归的定式偏差的定式偏差第一第一节节 变变量关系非量关系非线线性性第二第二节节 异常异常值值第三第三节节 规规律性律性扰动扰动第四第四节节 解解释变释变量缺落量缺落第五第五节节 参数参

2、数变变化化.第一第一节节 变变量关系非量关系非线线性性(一)(一)问题问题(二)(二)发现发现和判断和判断(三)(三)问题问题的的处处理和非理和非线线性回性回归归 1. 1.泰勒泰勒级级数展开法数展开法 2. 2.非非线线性最小二乘法性最小二乘法.(一)(一)问题问题例:例:变变量之量之间间的真的真实实关系关系 其中其中 满满足足 和和线线性回性回归归模型的其他假模型的其他假设设。 使用的模型使用的模型 因因为为 所以所以 不可能不可能 始始终为终为0 0。.例:例:变变量之量之间间的真的真实实关系关系 其中其中 满满足足 和和线线性回性回归归模型的其他假模型的其他假设设。 使用的模型使用的模

3、型 变换变换 后模型后模型为为 因因为为 不可能始不可能始终为终为0 0。回回归归分析的有效性失去了保障分析的有效性失去了保障.(二)(二)发现发现和判断和判断用数理用数理经济经济分析方法,分析方法,对对模型的关系模型的关系进进行行更深入的分析。更深入的分析。根据数据及其分布根据数据及其分布图图形、散点形、散点图进图进行直接行直接判断。判断。非非线线性性变变量关系的残差序列量关系的残差序列图图.(三)(三)问题问题的的处处理和非理和非线线性回性回归归1、模型修正和、模型修正和变换变换 恢复模型的合理非恢复模型的合理非线线性形式性形式 然后再然后再变换变换成成线线性模型性模型.泰勒泰勒级级数展开

4、法数展开法2 2、泰勒、泰勒级级数展开法数展开法 假假设设一个非一个非线线性的性的变变量关系量关系为为: 在在 处对处对 作泰勒作泰勒级级数展开:数展开:. 整理可得:整理可得: 若令:若令: 可以得到:可以得到:泰勒泰勒级级数展开的反复迭代数展开的反复迭代. 3、非、非线线性最小二乘法性最小二乘法 (非(非线线性最性最优优化等)化等) 直接用直接用Eviews软软件件进进行估行估计计。.例例51:某地某地总总消消费费和收入两个和收入两个变变量的数据如下表所示。量的数据如下表所示。Y为为总总收入,收入,C是消是消费费.散点散点图图C在在Eviews中中专门专门用于表示常数用于表示常数项项,因此

5、用,因此用CC表表示消示消费费。.线线性回性回归结归结果果.残差序列残差序列图图.非非线线性回性回归结归结果果.第二第二节节 异常异常值值问题问题异常异常值值的的发现发现和判断和判断问题问题的的处处理理.(一)(一) 问题问题现实经济现实经济中常常存在中常常存在这样这样的情况,一些突的情况,一些突发发事件事件或或变变化化对经济对经济活活动动或或经济经济关系造成短关系造成短暂暂的但确的但确实实很很显显著的冲著的冲击击影响。影响。这这些影响既不能被看作微小的随机些影响既不能被看作微小的随机扰动扰动,但又不,但又不会决定或改会决定或改变长变长期的期的经济经济关系。关系。这这种情况在种情况在经济经济数

6、据中反映出来,就会表数据中反映出来,就会表现为现为一个脱离基本一个脱离基本趋势趋势的异常的异常值值。如果所研究的如果所研究的经济问题经济问题或者相关数据中存在或者相关数据中存在这这种种情况,建立情况,建立线线性回性回归归模型模型时时又没有又没有预预先先处处理或剔理或剔除除这这种影响,就会表种影响,就会表现为现为模型模型误误差差项项在相在相应时应时点点存在均存在均值值非非0的的问题问题。.(一)(一) 问题问题的特征的特征例如例如变变量量 和和 在在长长期的关系中,基本上都期的关系中,基本上都满满足足线线性性回回归归模型的各个假模型的各个假设设,但在,但在时时刻刻 有了一个突有了一个突发发情况,

7、如果仍然用情况,如果仍然用线线性回性回归归模型模型这这个模型的个模型的误误差差项项 的均的均值值,实际实际上就是上就是 .(一)(一) 问题问题的特征的特征这这种情况如果不作种情况如果不作处处理,那么理,那么线线性回性回归结归结果就会差果就会差强强人意。人意。因因为为此此时时适用普通最小二乘法的前提条件适用普通最小二乘法的前提条件即模型的第二条假即模型的第二条假设设不成立,参数估不成立,参数估计计量量的性的性质质和相关和相关统计统计推断都会失效。推断都会失效。.(二)(二)发现发现和判断和判断克服异常克服异常值对线值对线性回性回归归分析影响的前提,是分析影响的前提,是发现发现和判和判断异常断异

8、常值值是否存在和在哪些是否存在和在哪些时时点存在。点存在。方法一是分析方法一是分析经济问题经济问题的相关背景情况,包括的相关背景情况,包括对经济对经济现现象、相关社会象、相关社会经济经济事件、以及数据序列的直接分析。事件、以及数据序列的直接分析。方法二是方法二是进进行残差序列分析。行残差序列分析。这这是从技是从技术术角度角度发现发现和和判断异常判断异常值问题值问题的基本方法。因的基本方法。因为为异常异常值值只是个只是个别别情情况,因此即使模型存在异常况,因此即使模型存在异常值问题值问题,最小二乘估,最小二乘估计计仍仍是一致估是一致估计计量,回量,回归归残差仍然能很好的近似得出模型残差仍然能很好

9、的近似得出模型的的误误差差项项,回,回归归残差中会包含由于异常残差中会包含由于异常值值所所导导致模型致模型误误差差项项均均值值非非0的信息。的信息。 .(二)(二)发现发现和判断和判断基本方法:回基本方法:回归归残差序列分析残差序列分析具体方法:模型假定成立的前提下,残差服从正具体方法:模型假定成立的前提下,残差服从正态态分布分布l根据残差序列根据残差序列计计算残差的算残差的标标准差准差l用用 去除各个残差,如果去除各个残差,如果发现发现某个残差某个残差 存在存在 的情况的情况时时,应该应该高度高度怀怀疑模型在疑模型在时时点点 存在异常存在异常值问题值问题.(二)(二)发现发现和判断和判断异常

10、异常值值的的检验检验注意有注意有经济经济意意义义的根据。的根据。.(三)(三)问题问题的的处处理理问题问题方法:引入一个方法:引入一个针对针对性的虚性的虚拟变拟变量,定量,定义义式式为为 得到一个新的回得到一个新的回归归模型模型.(三)(三)问题问题的的处处理理由于两个模型的由于两个模型的误误差差项项之之间间有关系有关系因此因此.例:例:P66.引入虚引入虚拟变拟变量后的回量后的回归结归结果果.引入虚引入虚拟变拟变量后的回量后的回归归残差残差图图.第三第三节节 规规律性律性扰动扰动问题问题问题问题的的发现发现与判断与判断问题问题的的处处理理.一、一、问题问题除了异常除了异常值问题值问题以外,周

11、期性或其它以外,周期性或其它规规律性律性扰动扰动,也会使也会使线线性回性回归归模型的模型的误误差差项项偏离零均偏离零均值值的假的假设设。此外,在横截面数据此外,在横截面数据计计量量经济经济分析中,分析中,观测对观测对象象的性的性别别、年、年龄龄、受教育程度等特征差异,也是、受教育程度等特征差异,也是规规律性律性扰动扰动因素。因素。这这些些问题问题不影响不影响变变量关系的量关系的总总体体趋势趋势,但都会,但都会对对变变量关系量关系产产生生规规律性影响,如果不律性影响,如果不预预先加以先加以处处理理或排除掉,就会或排除掉,就会导导致致误误差差项项均均值值非零的非零的问题问题出出现现,影响回影响回归

12、归分析的效果。分析的效果。.一、一、问题问题例如,例如,变变量量Y的季度数据中,第一季度的季度数据中,第一季度总总会受到一个季会受到一个季节节性因素的影响。性因素的影响。如果我如果我们们忽忽视这视这种影响,用两种影响,用两变变量模型量模型或多元模型或多元模型研究研究Y的的规规律,就会遇到律,就会遇到误误差差项项非非0问题问题,即,即.二、二、问题问题的的发现发现和判断和判断经济问题经济问题背景分析背景分析回回归归残差序列残差序列图图分析分析两种分析相两种分析相结结合,确定其是否属于合,确定其是否属于规规律性律性扰动扰动.三、三、问题问题的的处处理理解决解决规规律性律性扰动问题扰动问题的方法之一

13、就是的方法之一就是对对数据数据进进行行统计统计平滑平滑处处理,消除季理,消除季节节性或其他周期性性或其他周期性扰动扰动的的影响。但影响。但这样这样容易容易产产生两个生两个问题问题:一是不能区:一是不能区别别趋势趋势因素和季因素和季节节性性扰动扰动,不能真正确定所研究,不能真正确定所研究变变量关系的具体量关系的具体变变化化轨轨迹,二是容易迹,二是容易导导致致误误差序列差序列自相关自相关问题问题。因此,它不是克服。因此,它不是克服规规律性律性扰动对线扰动对线性回性回归归分析影响的好方法分析影响的好方法处处理理规规律性律性扰动扰动的的较较好方法是引好方法是引进进虚虚拟变拟变量,有量,有时时需要引需要

14、引进进多个虚多个虚拟变拟变量。量。.例如(例如(1)在上个例子中,第一季度存在季在上个例子中,第一季度存在季节节性因素的影性因素的影响,在响,在这这个例子中,可使用虚个例子中,可使用虚拟变拟变量量把模型改把模型改为为或或那么新模型的那么新模型的误误差差项项就不再存在均就不再存在均值值非非0的的问题问题,回,回归归分析分析的效果就能得到保的效果就能得到保证证。.例如(例如(2)如果第一季度受到一种季如果第一季度受到一种季节节性因素影响,第三季度受到另性因素影响,第三季度受到另一种方向和力度不同的因素的一种方向和力度不同的因素的扰动扰动,那么可以引,那么可以引进进两个两个虚虚拟变拟变量,即量,即和

15、和将两个虚将两个虚拟变拟变量引入模型,模型量引入模型,模型变为变为或或.对对于截面数据于截面数据计计量分析的例子量分析的例子对对于截面数据于截面数据计计量分析中,量分析中,观测对观测对象特征差异象特征差异导导致的致的规规律律性性扰动扰动,也可以利用虚,也可以利用虚拟变拟变量加以量加以处处理。理。如如观测对观测对象的性象的性别别是一个影响因素,解决的是一个影响因素,解决的办办法就是在模法就是在模型中引型中引进进虚虚拟变拟变量,即量,即n这这个虚个虚拟变拟变量就能解决由于量就能解决由于观测对观测对象的性象的性别别因素所因素所导导致的致的误误差差项项均均值值非非0问题问题。.注注 意意利用虚利用虚拟

16、变拟变量解决量解决扰动问题时扰动问题时,引,引进进虚虚拟变拟变量是有量是有限度的,因限度的,因为为引引进进一个虚一个虚拟变拟变量就意味着要多估量就意味着要多估计计一个参数和一个参数和损损失一个自由度,失一个自由度,对对回回归归分析的效果有分析的效果有不利影响。不利影响。引引进进虚虚拟变拟变量要注意量要注意“虚虚拟变拟变量陷阱量陷阱”。即属性和。即属性和类别类别的个数与虚的个数与虚拟变拟变量个数一致,模型无截距。如量个数一致,模型无截距。如上述季上述季节节性性扰动扰动模型同模型同时时引引进对应进对应全部全部4个季个季节节的,的,按照按照类类似似规则规则定定义义的四个虚的四个虚拟变拟变量量 那那么

17、因么因为这为这4个虚个虚拟变拟变量相加等于量相加等于1,则则当当这这四个四个变变量同量同时时出出现现在一个模型中,必然在一个模型中,必然导导致解致解释变释变量量严严格格线线性相关,性相关,导导致模型的崩致模型的崩溃溃。同。同样样,在考,在考虑虑性性别别因因素素时时,若同,若同时时引引进进男性和女性两个虚男性和女性两个虚拟变拟变量也会落量也会落入虚入虚拟变拟变量陷阱,所以,引量陷阱,所以,引进进虚虚拟变拟变量量时时,应该谨应该谨慎。慎。 .例例题题 (考(考虑虑性性别别的一个回的一个回归归模型)模型) 性别(性别(1 1为男性、为男性、0 0为女性)为女性)m m教龄教龄x x年薪(千美元)年薪

18、(千美元)y y1 11 123230 01 119.519.51 12 224 24 0 02 221211 13 325250 03 322221 14 426.526.50 04 423.123.10 05 525251 15 528281 16 629.529.50 06 626260 07 727.527.51 17 731.531.50 08 82929.看年薪和教看年薪和教龄龄之之间间的散点的散点图图. 不加虚不加虚拟变拟变量的回量的回归结归结果果.加上虚加上虚拟变拟变量后的回量后的回归结归结果果.第四第四节节 解解释变释变量缺落量缺落问题问题发现发现与判断与判断问题问题的的处处

19、理理.问题问题解解释变释变量缺落,也是引起量缺落,也是引起误误差差项项均均值值非非0问题问题的常的常见见原因。原因。所所谓谓解解释变释变量缺落,就是量缺落,就是线线性回性回归归模型模型设设定的定的变变量关系中,忽略了某些重要的、量关系中,忽略了某些重要的、对对被解被解释变释变量有量有趋势趋势性影响的因素。性影响的因素。被忽略的因素被忽略的因素对对被解被解释变释变量的影响,会从量的影响,会从误误差差项项中表中表现现出来,出来,导导致致误误差不再是差不再是纯纯粹粹的随机的随机扰动扰动。.例如例如若真若真实实的的变变量关系量关系为为若采用若采用变变量关系量关系.发现发现和判断:和判断:经济经济背景分

20、析和残差序列分背景分析和残差序列分析析e.问题问题的的处处理理根据找到的原因即缺落的解根据找到的原因即缺落的解释变释变量,量,针对针对性的加入性的加入该该缺落的解缺落的解释变释变量,就可以解决量,就可以解决问题问题。.第五第五节节 参数参数变变化化问题问题发现发现和判断和判断问题问题的解决的解决.问题问题参数改参数改变变是指在考察期是指在考察期间间(样样本数据范本数据范围围),变变量关系中的参数量关系中的参数发发生生变变化,化,这这种种问题问题也可以被理解也可以被理解为为模型的模型的稳稳定性定性问题问题。这时实际这时实际上不能用同一个上不能用同一个线线性回性回归归模型研模型研究究变变量在整个考

21、察期量在整个考察期间间的关系。的关系。如果忽如果忽视这视这种模型参数种模型参数变变化,也会化,也会导导致致误误差差项项均均值值非非0问题问题。.问题问题以两以两变变量量线线性关系在考察期【性关系在考察期【0,T】中的】中的t时时刻参数刻参数发发生生变变化化为为例。例。这这种情况下,真种情况下,真实实的的变变量关系可以用【量关系可以用【0,t】和】和【t,T】两个】两个时时期中的两个模型分期中的两个模型分别别表示,即表示,即其中,其中, 和和 都都满满足均足均值为值为0和和线线性回性回归归模型的其它假模型的其它假设设,且,且如果忽略模型参数的如果忽略模型参数的变变化,用同一化,用同一变变量关系量

22、关系代表代表Y和和X在整个【在整个【0,T】时时期的关系,那么在两个期的关系,那么在两个时时期中的期中的误误差差项项就分就分别为别为.和和因此,两个因此,两个时时期期误误差差项项的均的均值值分分别为别为和和很很显显然,除非然,除非 和和 同同时时成立,否成立,否则则 的均的均值值不可能在两个不可能在两个时时期都始期都始终为终为0。因此在参数因此在参数发发生改生改变时变时,必然,必然导导致致误误差差项项均均值值非非0的的问问题题。.二、二、发现发现和判断和判断发现发现和判断模型参数改和判断模型参数改变变的基本方法,也是的基本方法,也是经济问题经济问题背景分析和残差序列分析相背景分析和残差序列分析

23、相结结合。合。如果以如果以i为为横横轴轴,残差,残差e为纵轴为纵轴的残差序列分的残差序列分布,存在某个布,存在某个时时期附近期附近转转折的情况,就折的情况,就应该应该考考虑变虑变量关系在量关系在该时该时刻可能存在参数改刻可能存在参数改变变。.邹检验邹检验以以怀怀疑疑发发生生结结构参数构参数变变化的化的时时点点为为界,把界,把观测样观测样本分本分为为两两组组(每(每组样组样本容量必本容量必须须大于模型的解大于模型的解释变释变量数),量数), 分分别为别为两个子两个子样样本的本的样样本容量。本容量。对对两个子两个子样样本和全本和全样样本分本分别进别进行回行回归归,将两,将两组组子子样样本回本回归归

24、的残差平方和加的残差平方和加总总得到得到 ,称,称为为无无约约束的残差平方和,束的残差平方和,它的自由度它的自由度为为 全全样样本的回本的回归归残差平方和残差平方和为为 ,自由度,自由度为为 称称为为有有约约束的残差平方和。用束的残差平方和。用“有有约约束的残束的残差平方和差平方和”减去减去“无无约约束的残差平方和束的残差平方和”,自由度,自由度为为K+1。.邹检验邹检验 F(K+1, ).左表给出19701991年各年的个人储蓄Y和个人收入X的数据 ,均以10亿美元计。用邹检验以判明从时期19701980年到时期19811991年储蓄收入关系是否出现显著变化。.F【(【(19953.781010.8425103.470)/2】/ 【(【(1010.842+5103.470)/(22-2-2)】)】 20.362 F的的临临界界值值在在95的置信度下的置信度下为为3.55,在,在99的置信度下的置信度下为为6.01,F的的值值明明显显大于大于F的的临临界界值值,所以判定所以判定结结构不构不稳稳定,在定,在1981年年发发生了生了结结构构变变化。化。.利用虚利用虚拟变拟变量量检验结检验结构的构的稳稳定性定性引入虚引入虚拟变拟变量:量:模型模型设设定定为为.上述上述结结果表明,截距和斜率均果表明,截距和斜率均发发生生显显著著变变化,即化,即结结构构不不稳稳定。定。.

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号