虚拟变量的分析

上传人:wt****50 文档编号:33548412 上传时间:2018-02-15 格式:DOC 页数:8 大小:379KB
返回 下载 相关 举报
虚拟变量的分析_第1页
第1页 / 共8页
虚拟变量的分析_第2页
第2页 / 共8页
虚拟变量的分析_第3页
第3页 / 共8页
虚拟变量的分析_第4页
第4页 / 共8页
虚拟变量的分析_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《虚拟变量的分析》由会员分享,可在线阅读,更多相关《虚拟变量的分析(8页珍藏版)》请在金锄头文库上搜索。

1、1虚拟变量(dummy variable)在实际建模过程中,被解释变量不但受定量变量影响,同时还受定性变量影响。例如需要考虑性别、民族、不同历史时期、季节差异、企业所有制性质不同等因素的影响。这些因素也应该包括在模型中。由于定性变量通常表示的是某种特征的有和无,所以量化方法可采用取值为 1 或 0。这种变量称作虚拟变量,用 D 表示。虚拟变量应用于模型中,对其回归系数的估计与检验方法与定量变量相同。1截距移动设有模型,yt = 0 + 1 xt + 2D + ut ,其中 yt,x t 为定量变量;D 为定性变量。当 D = 0 或 1 时,上述模型可表达为,yt =)(120uxtt0204

2、060204060XY图 8.1 测量截距不同D = 1 或 0 表示某种特征的有无。反映在数学上是截距不同的两个函数。若 2 显著不为零,说明截距不同;若 2 为零,说明这种分类无显著性差异。例:中国成年人体重 y(kg)与身高 x(cm )的回归关系如下:105 + x D = 1 (男)y = - 100 + x - 5D = 100 + x D = 0 (女)注意: 若定性变量含有 m 个类别,应引入 m-1 个虚拟变量,否则会导致多重共线性,称作虚拟变量陷阱(dummy variable trap) 。 关于定性变量中的哪个类别取 0,哪个类别取 1,是任意的,不影响检验结果。 定性

3、变量中取值为 0 所对应的类别称作基础类别(base category) 。 对于多于两个类别的定性变量可采用设一个虚拟变量而对不同类别采取赋值不同的方法处理。如:1 (大学 )D = 0 (中学)-1 (小学)。0 0+2 D = 1 D =0 2例 1:市场用煤销售量模型(file: Dummy1 )我国市场用煤销量的季节性数据(1982-1988 , 中国统计年鉴1987,1989)见下图与表。由于受取暖用煤的影响,每年第四季度的销售量大大高于其它季度。鉴于是季节数据可设三个季节变量如下:1 (4 季度) 1 (3 季度) 1 (2 季度) D1 = D2 = D3 =0 (1, 2,

4、3 季度) 0 (1, 2, 4 季度) 0 (1, 3, 4 季度)25035045050883848586878Y25035045050883848586878Y2731.0+57.1*T全国按季节市场用煤销售量数据(file: Dummy1)季度 Yt t D1 D2 D3 季度 Yt t D1 D2 D31982.1 2599.8 1 0 0 0 1985.3 3159.1 15 0 1 01982.2 2647.2 2 0 0 1 1985.4 4483.2 16 1 0 01982.3 2912.7 3 0 1 0 1986.1 2881.8 17 0 0 01982.4 4087

5、.0 4 1 0 0 1986.2 3308.7 18 0 0 11983.1 2806.5 5 0 0 0 1986.3 3437.5 19 0 1 01983.2 2672.1 6 0 0 1 1986.4 4946.8 20 1 0 01983.3 2943.6 7 0 1 0 1987.1 3209.0 21 0 0 01983.4 4193.4 8 1 0 0 1987.2 3608.1 22 0 0 11984.1 3001.9 9 0 0 0 1987.3 3815.6 23 0 1 01984.2 2969.5 10 0 0 1 1987.4 5332.3 24 1 0 019

6、84.3 3287.5 11 0 1 0 1988.1 3929.8 25 0 0 01984.4 4270.6 12 1 0 0 1988.2 4126.2 26 0 0 11985.1 3044.1 13 0 0 0 1988.3 4015.1 27 0 1 01985.2 3078.8 14 0 0 1 1988.4 4904.2 28 1 0 0数据来源:中国统计年鉴1989。注:以季节数据 D1 为例,EViews 命令是 D1= seas(4)。以时间 t 为解释变量(1982 年 1 季度取 t = 1)的煤销售量( y)模型如下:y = 2431.20 + 49.00 t +

7、1388.09 D1 + 201.84 D2 + 85.00 D3 (1)(26.04) (10.81) (13.43) (1.96) (0.83)R2 = 0.95, DW = 1.2, s.e. = 191.7, F=100.4, T=28, t0.05 (28-5) = 2.07由于 D2,D 3 的系数没有显著性,说明第 2,3 季度可以归并入基础类别第 1 季度。于是只考虑加入一个虚拟变量 D1,把季节因素分为第四季度和第一、二、三季度两类。从上式中剔除虚拟变量 D2,D 3,得煤销售量(y)模型如下:y = 2515.86 + 49.73. t + 1290.91 D1 (2)(3

8、2.03 (10.63) (14.79) R2 = 0.94, DW = 1.4, s.e. = 198.7, F = 184.9, T=28, t0.05 (25) = 2.06进一步检验斜率是否有变化,在上式中加入变量 t D1,y = 2509.07 + 50.22 t + 1321.19 D1 - 1.95 t D1 (3)(28.24) (9.13) (6.85) (-0.17)3R2 = 0.94, DW = 1.4, s.e. = 202.8, F = 118.5, T=28, t0.05 (24) = 2.06由于回归系数 -1.95 所对应的 t 值是 -0.17,可见斜率未

9、发生变化。因此以模型 (2) 作为最后确立的模型。若不采用虚拟变量,得回归结果如下,y = 2731.03 + 57.15 t (4)(11.6) (4.0)R2 = 0.38, DW = 2.5, s.e. = 608.8, T = 28, t0.05 (26) = 2.06与(2)式相比,回归式(4)显得很差。2斜率变化以上只考虑定性变量影响截距,未考虑影响斜率,即回归系数的变化。当需要考虑时,可建立如下模型:yt = 0 + 1 xt + 2 D + 3 xt D + ut ,其中 xt 为定量变量; D 为定性变量。当 D = 0 或 1 时,上述模型可表达为,yt =)()(3120

10、uxtt通过检验 3 是否为零,可判断模型斜率是否发生变化。02040608010204060XY 102304506700204060TY图 8.5 情形 1(不同类别数据的截距和斜率不同) 图 8.6 情形 2(不同类别数据的截距和斜率不同)例 2:用虚拟变量区别不同历史时期(file:dummy2)中国进出口贸易总额数据(1950-1984 )见上表。试检验改革前后该时间序列的斜率是否发生变化。定义虚拟变量 D 如下0 (1950 - 1977)D = 1 (1978 - 1984 )4中国进出口贸易总额数据(1950-1984 ) (单位:百亿元人民币)年 trade time D t

11、ime D 年 trade time D time D1950 0.415 1 0 0 1968 1.085 19 0 01951 0.595 2 0 0 1969 1.069 20 0 01952 0.646 3 0 0 1970 1.129 21 0 01953 0.809 4 0 0 1971 1.209 22 0 01954 0.847 5 0 0 1972 1.469 23 0 01955 1.098 6 0 0 1973 2.205 24 0 01956 1.087 7 0 0 1974 2.923 25 0 01957 1.045 8 0 0 1975 2.904 26 0 01

12、958 1.287 9 0 0 1976 2.641 27 0 01959 1.493 10 0 0 1977 2.725 28 0 01960 1.284 11 0 0 1978 3.550 29 1 291961 0.908 12 0 0 1979 4.546 30 1 301962 0.809 13 0 0 1980 5.638 31 1 311963 0.857 14 0 0 1981 7.353 32 1 321964 0.975 15 0 0 1982 7.713 33 1 331965 1.184 16 0 0 1983 8.601 34 1 341966 1.271 17 0

13、0 1984 12.010 35 1 351967 1.122 18 0 0以时间 time 为解释变量,进出口贸易总额用 trade 表示,估计结果如下:trade = 0.37 + 0.066 time - 33.96D + 1.20 time D(1.86) (5.53) (-10.98) (12.42)0.37 + 0.066 time (D = 0, 1950 - 1977) = - 33.59 + 1.27 time (D = 1, 1978 - 1984) 上式说明,改革前后无论截距和斜率都发生了变化。进出口贸易总额的年平均增长量扩大了 18 倍。例 3:香港季节 GDP 数据(

14、单位:千亿港元)的拟合(虚拟变量应用, file:dummy6 )1.01.52.02.53.03.54.091923945967980102GDP1.01.52.02.53.03.54.091923945967980102GDP1.6952+0.37*T19901997 年香港季度 GDP 呈线性增长。1997 年由于遭受东南亚金融危机的影响,经济发展处于停滞状态,19982002 年底 GDP 总量几乎没有增长(见上图) 。对这样一种先增长后停滞,且含有季节性周期变化的过程简单地用一条直线去拟合显然是不恰当的。为区别不同季节,和不同时期,定义季节虚拟变量 D2、D3、D4 和区别不同时期的虚拟变量DT 如下(数据见附录):1 (第 2 季度)D2 = 0 (其他季度)51 (第 3 季度)D3 = 0 (其他季度)1 (第 4 季度)D4 = 0 (其他季度)1 (1998:12002:4)DT = 0 (1990:1 1997:4)得估计结果如下:GDPt = 1.1573 + 0.0668 t + 0.0775 D2 + 0.2098 D3 + 0.2349 D4+ 1.8338 DT - 0.0654 DT t(50.8) (64.6) (3.7) (9.9) (11.0) (19.9) (-28.0)R2 = 0.99, DW = 0.9, s.

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号