模型中的特殊解释变量虚拟变量经济

上传人:cn****1 文档编号:579458965 上传时间:2024-08-26 格式:PPT 页数:16 大小:560.02KB
返回 下载 相关 举报
模型中的特殊解释变量虚拟变量经济_第1页
第1页 / 共16页
模型中的特殊解释变量虚拟变量经济_第2页
第2页 / 共16页
模型中的特殊解释变量虚拟变量经济_第3页
第3页 / 共16页
模型中的特殊解释变量虚拟变量经济_第4页
第4页 / 共16页
模型中的特殊解释变量虚拟变量经济_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《模型中的特殊解释变量虚拟变量经济》由会员分享,可在线阅读,更多相关《模型中的特殊解释变量虚拟变量经济(16页珍藏版)》请在金锄头文库上搜索。

1、第第8 8章章 模型中的特殊解释变量模型中的特殊解释变量8.3 8.3 虚拟变量模型虚拟变量模型 8.3 8.3 虚拟变量虚拟变量(重点掌握)(重点掌握) 许多经济变量是可以定量度量的,许多经济变量是可以定量度量的,如:如:商品需求量、商品需求量、价格、收入、产量等。但也有一些影响经济变量的价格、收入、产量等。但也有一些影响经济变量的因素因素无法定量度量无法定量度量,如:如:职业、性别对收入的影响;职业、性别对收入的影响;战争、自然灾害对战争、自然灾害对GDP的影响;季节对某些产品的影响;季节对某些产品(如冷饮)销售的影响等等。(如冷饮)销售的影响等等。为了在模型中能够反映这些因素的影响,并提

2、高模为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们型的精度,需要将它们“量化量化”。这种这种“量化量化”通常是通过引入通常是通过引入“虚拟变量虚拟变量”来完成的。根据这些因素的属性类型,构造来完成的。根据这些因素的属性类型,构造只取只取“0”或或“1”的人工变量,通常称为的人工变量,通常称为虚虚拟变量拟变量(dummy variables),记为),记为D。例如例如,反映文程度的虚拟变量可取为,反映文程度的虚拟变量可取为: 1, 本科学历本科学历 D= 0, 非本科学历非本科学历注意:注意:(1) 当定性变量含有当定性变量含有m个类别时个类别时,模型不能引入,模型不能引入m个

3、虚个虚拟变量。拟变量。最多只能引入最多只能引入m -1个虚拟变量个虚拟变量,否则当模型中存在,否则当模型中存在截距项时就会产生完全多重共线性,无法估计回归参数。截距项时就会产生完全多重共线性,无法估计回归参数。(2) 把虚拟变量取值为把虚拟变量取值为0所对应的类别称作所对应的类别称作基础类别基础类别。(3) 当定性变量含有当定性变量含有m个类别时,不能把虚拟变量的值设成如个类别时,不能把虚拟变量的值设成如下形式。下形式。这种赋值法在一般情形下与虚拟变量赋值是完全不同的两这种赋值法在一般情形下与虚拟变量赋值是完全不同的两回事。回事。(4) 回归模型可以只用虚拟变量作解释变量,也可以用定回归模型可

4、以只用虚拟变量作解释变量,也可以用定量变量和虚拟变量一起做解释变量。量变量和虚拟变量一起做解释变量。 (第(第3版教材第版教材第189页)页)1. 用虚拟变量测量截距变动用虚拟变量测量截距变动设有模型,设有模型, yt = 0 + 1 xt + 2D + ut ,其中其中yt,xt为定量变量;为定量变量;D为定性变量。为定性变量。当当D = 0 或或1时,上述模型可表达为,时,上述模型可表达为,D = 1或或0表示某种特征的有无。反映在数学上是截距不同的两个函数。表示某种特征的有无。反映在数学上是截距不同的两个函数。若若 2显著不为零,说明截距不同;若显著不为零,说明截距不同;若 2为零,说明

5、这种分类无显著性为零,说明这种分类无显著性差异。差异。D = 1 D = 000+2例例8.3 随机调查美国旧金山地区随机调查美国旧金山地区20个家庭的储蓄情况,拟建立年储蓄额个家庭的储蓄情况,拟建立年储蓄额Yi (千美元千美元) 对年收入对年收入Xi (千美元千美元) 的回归模型。通过对样本点的分析发现,的回归模型。通过对样本点的分析发现,居于上部的居于上部的6个点(用小圆圈表示)都是代表自己有房子的家庭;居于下个点(用小圆圈表示)都是代表自己有房子的家庭;居于下部的部的14个点(用小三角表示)都是租房住的家庭。而这两类家庭所对应的个点(用小三角表示)都是租房住的家庭。而这两类家庭所对应的观

6、测点各自都表现出明显的线性关系。于是给模型加入一个定性变量观测点各自都表现出明显的线性关系。于是给模型加入一个定性变量“住住房状况房状况”,用,用D表示。定义如下:表示。定义如下:(第(第3版教材第版教材第189页)页)例例8.3 建立回归模型建立回归模型Yi = 0 + 1 Xi + 2 Di + ut 得估计结果如下,得估计结果如下,= - 0.3204 + 0.0675 Xt + 0.8273 D i (-5.2) (16.9) (11.0) R2 = 0.99, DW = 2.27由于回归系数由于回归系数0.8273显著地不为零,说明对住房状况不同的两类家庭来显著地不为零,说明对住房状

7、况不同的两类家庭来说,回归函数截距项确实明显不同。说,回归函数截距项确实明显不同。当模型不引入虚拟变量当模型不引入虚拟变量“住房状况住房状况”时,得回归方程如下,时,得回归方程如下, = - 0.5667 + 0.0963 Xi (-3.5) (11.6) R2 = 0.88, DW = 1.85比较回归方程,前者的确定系数为比较回归方程,前者的确定系数为0.99,后者的确定系数仅为,后者的确定系数仅为0.88。说。说明该回归模型中引入虚拟变量非常必要。明该回归模型中引入虚拟变量非常必要。(第(第3版教材第版教材第190页)页) “季节季节”是在研究经济问题中常常遇到的定性因素。比如,酒,肉的

8、销是在研究经济问题中常常遇到的定性因素。比如,酒,肉的销量在冬季要超过其它季节,而饮料的销量又以夏季为最大。当建立这类量在冬季要超过其它季节,而饮料的销量又以夏季为最大。当建立这类问题的计量模型时,就要考虑把问题的计量模型时,就要考虑把“季节季节”因素引入模型。由于一年有四因素引入模型。由于一年有四个季节,所以这是一个含有四个类别的定性变量。应该向模型引入三个个季节,所以这是一个含有四个类别的定性变量。应该向模型引入三个虚拟变虚拟变量量。 例例8.4 市场用煤销售量模型市场用煤销售量模型。由于受取暖用煤的影响,每年第四季度的由于受取暖用煤的影响,每年第四季度的销售量大大高于其它季度。鉴于是季节

9、数据可设三个季节变量如下:销售量大大高于其它季度。鉴于是季节数据可设三个季节变量如下: (第(第2版第版第224页)页)(第(第3版第版第192页)页)以时间以时间 t 为解释变量(为解释变量(1982年年1季度取季度取t = 1)的煤销售量()的煤销售量(Yi)模型估计结)模型估计结果如下:果如下: = 2431.20 + 49.00 t + 1388.09 D1 + 201.84 D2 + 85.00 D3 (26.04) (10.81) (13.43) (1.96) (0.83) R2 = 0.95, DW = 1.2, F=100.4, T=28, t0.05 (28-5) = 2.0

10、7由于由于D2,D3的系数没有显著性,说明第二、三季度可以归并入基础类别第的系数没有显著性,说明第二、三季度可以归并入基础类别第一季度。于是只考虑加入一个虚拟变量一季度。于是只考虑加入一个虚拟变量D1,把季节因素分为第四季度和第,把季节因素分为第四季度和第一、二、三季度两类。从上式中剔除虚拟变量一、二、三季度两类。从上式中剔除虚拟变量D2,D3,得煤销售量(,得煤销售量(Yi)模型如下:模型如下: = 2515.86 + 49.73 t + 1290.91 D1 (32.03 (10.63) (14.79) R2 = 0.94, DW = 1.4, F = 184.9, T=28, t0.05

11、 (25) = 2.06这里第一、二、三季度为基础类别。这里第一、二、三季度为基础类别。例例8.4(第(第2版第版第224页)页)(第(第3版第版第192页)页)2. 测量斜率变动测量斜率变动以上介绍了用虚拟变量测量回归函数的截距变化。实际上,也可以用虚拟以上介绍了用虚拟变量测量回归函数的截距变化。实际上,也可以用虚拟变量考察回归函数的斜率是否发生变化。方法是在模型中加入变量考察回归函数的斜率是否发生变化。方法是在模型中加入定量变量与定量变量与虚拟变量的乘积项虚拟变量的乘积项。设模型如下,。设模型如下,Yi = 0 + 1 Xi + 2 Di + 3 (Xi Di) + ui 按按 2, 3

12、是否为零,回归函数可有如下四种形式。是否为零,回归函数可有如下四种形式。 E(Yi) = 0 + 1 Xi , (当当 2 = 3 = 0) E(Yi) = ( 0 + 2) + ( 1 + 3) Xi , (当当 2 0, 3 0) E(Yi) = 0 + ( 1 + 3) Xi , (当当 2 = 0, 3 0) E(Yi) = ( 0 + 2) + 1 Xi , (当当 2 0, 3 = 0)截距、斜率同时发生变化的两种情形见图。截距、斜率同时发生变化的两种情形见图。 3. 分段线性回归(不讲)分段线性回归(不讲) 例例8.5 中国进出口贸易总额序列(中国进出口贸易总额序列(195019

13、84年)如图。试检验改革开放年)如图。试检验改革开放前后该时间序列的斜率是否发生变化。定义虚拟变量前后该时间序列的斜率是否发生变化。定义虚拟变量D如下,如下, 以时间以时间time为解释变量,进出口贸易总额用为解释变量,进出口贸易总额用trade表示,估计结果如下,表示,估计结果如下, = 0.2818 + 0.0746 time - 35.8809D + 1.2559 time D (1.35) (6.2) (-8.4) (9.6) 上式说明,改革开放前后相比无论截距和上式说明,改革开放前后相比无论截距和斜率都发生了变化。进出口贸易总额的斜率都发生了变化。进出口贸易总额的年平均增长量扩大了近

14、年平均增长量扩大了近17倍。倍。(第(第2版第版第226页)页)(第(第3版第版第194页)页)补充案例补充案例 :香港季节:香港季节GDPGDP数据(数据(千亿港元千亿港元)的拟合)的拟合(file:dummy6file:dummy6)19901997年香港季度年香港季度GDP呈线性增长。呈线性增长。1997年由于遭受东南亚金融危机的年由于遭受东南亚金融危机的影响,经济发展处于停滞状态,影响,经济发展处于停滞状态,19982002年底年底GDP总量几乎没有增长(见总量几乎没有增长(见上图)。对这样一种先增长后停滞,且含有季节性周期变化的过程简单地上图)。对这样一种先增长后停滞,且含有季节性周

15、期变化的过程简单地用一条直线去拟合显然是不恰当的。为区别不同季节,和不同时期,用一条直线去拟合显然是不恰当的。为区别不同季节,和不同时期,定义定义季节虚拟变量季节虚拟变量D2、D3、D4和区别不同时期的虚拟变量和区别不同时期的虚拟变量DT如下,如下,得估计结果如下:得估计结果如下: = 1.1573+0.0668t+0.0775D2+0.2098D3+0.2349D4+1.8338DT- 0.0654DT t (50.8) (64.6) (3.7) (9.9) (11.0) (19.9) (-28.0) R2 = 0.99, DW = 0.9, s.e. = 0.05, F=1198.4, T

16、=52, t0.05 (52-7) = 2.01对于对于1990:1 1997:4 = 1.1573 + 0.0668 t + 0.0775 D2 + 0.2098 D3 + 0.2349 D4对于对于1998:12002:4 = 2.9911 + 0.0014 t + 0.0775 D2 + 0.2098 D3 + 0.2349 D4例例3 3:香港季节:香港季节GDPGDP数据(千亿港元)的拟合(数据(千亿港元)的拟合(file:dummy6file:dummy6) 如果不采用虚拟变量拟合效果将很差。如果不采用虚拟变量拟合效果将很差。 = 1.6952 + 0.0377 t (20.6) (13.9) R2 = 0.80, DW = 0.3, T=52, t0.05 (52-2) = 2.01补充案例:补充案例:香港季节香港季节GDPGDP数数据的拟合据的拟合 8.4 8.4 时间变量时间变量以时间变量以时间变量t作解释变量。估计与检验方法作解释变量。估计与检验方法与定量解释变量与定量解释变量Xt相同。相同。Yt = + t + 0 Xt + ut Yt = + t + ut 如如时间变量时间变量t在生产函数模型中代表技术进步。在生产函数模型中代表技术进步。Lnyt = 0 + t + 1 Lnxt 1 + 2 Lnxt 2 + ut 第第8 8章结束章结束. .

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号