虚拟变量案例

上传人:s9****2 文档编号:468612039 上传时间:2022-08-10 格式:DOC 页数:9 大小:465KB
返回 下载 相关 举报
虚拟变量案例_第1页
第1页 / 共9页
虚拟变量案例_第2页
第2页 / 共9页
虚拟变量案例_第3页
第3页 / 共9页
虚拟变量案例_第4页
第4页 / 共9页
虚拟变量案例_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《虚拟变量案例》由会员分享,可在线阅读,更多相关《虚拟变量案例(9页珍藏版)》请在金锄头文库上搜索。

1、虚拟变量(dummy variable )在实际建模过程中, 被解释变量不但受定量变量影响,同时还受定性变量影响。 例如需要考虑性别、民族、不同历史时期、季节差异、企业所有制性质不同等因素的影响。这些因 素也应该包括在模型中。由于定性变量通常表示的是某种特征的有和无,所以量化方法可采用取值为1或0。这种变量称作虚拟变量,用 D表示。虚拟变量应用于模型中,对其回归系数的估计与检验方 法与定量变量相同。1. 截距移动设有模型,yt = o + ixt + 2D + ut ,o + ixt + ut ,(0 +2)+ixt + ut ,其中yt, xt为定量变量;D为定性变量。当 D = 0或1时,

2、上述模型可表达为,(D = 0)(D = 1)D = 1D =0图8.1测量截距不同D = 1或0表示某种特征的有无。反映在数学上是截距不同的两个函数。若2显著不为零,说明截距不同;若2为零,说明这种分类无显著性差异。例:中国成年人体重 y (kg)与身高x (cm)的回归关系如下:-05 + xD = 1 (男)y = -100 + x-5D =-100 + xD = 0 (女) 若定性变量含有 m个类别,应引入m-1个虚拟变量,否则会导致多重共线性,称作虚拟变量陷阱(dummy variable trap )。 关于定性变量中的哪个类别取0,哪个类别取1,是任意的,不影响检验结果。 定性变

3、量中取值为 0所对应的类别称作基础类别(base category )。 对于多于两个类别的定性变量可采用设一个虚拟变量而对不同类别采取赋值不同的 方法处理。如:f 1(大学)D = 0(中学)-1(小学)。GDP序列图不用虚拟变量的情形若不采用虚拟变量,得回归结果如下,GDP = 1.5427 + 0.0405 T(11.0)(3.5)R2 = 0.3991, DW = 2.6,s.e. = 0.3定义1(1季度)1( 2季度)1(3季度)D1 = D2 = TD3 = -0( 2, 3,4 季度)-0 (1, 3, 4 季度)-0 (1,2, 4 季度)第4季度为基础类别。GDP = 2.

4、0922 + 0.0315 T 0.8013 D1 0.5137 D2 -0.5014 D3(64.2)(15.9)(-24.9)(-16.1)(-15.8)R2 = 0.9863, DW = 1.96, s.e. = 0.05Dep endent Variable: GDFMet had: Least SquaresDate: 07/02/02 Time: 20:43Sample: 1996:1 2000:4Included ebservations: 20VariableCoefficientStd ErnorVStatistiicProb.C2 0922210,03257564.2274

5、0.0000T0,0314500 00197515.922870.0000D1-0.3013130.032153-24 921640.0000D2-.5137360.031B49-16.13059.0000D3-0.501386.031664-16.83444.0000Rquared0 966321Mean dependent var1.968340Adjusted R-squared.982673.D. dependent var0 379G09S. E. of regression0.049960Aloike info criterion-2 942546Sum squared re$id

6、0,037452Schwarz criterion-2 593613Log likelihood34.42546F-statistic270,3959Durbin-Watson stat1.962063Prob(F- statistic)0.000000年GDPtD1D2D31996:11.315611001996:21.660020101996:31.591930011996:42.2209640001997:11.4685651001997:21.8494860101997:31.797270011997:42.362080001998:11.5899491001998:21.883161

7、00101998:31.97044110011998:42.51176120001999:11.6784131001999:21.9405140101999:32.0611150011999:42.5254160002000:11.8173171002000:22.1318180102000:32.2633190012000:42.728020000数据来源:中国统计年鉴1998-2001附数据如下:2. 斜率变化以上只考虑定性变量影响截距,未考虑影响斜率,即回归系数的变化。当需要考虑时, 可建立如下模型:yt = 0 +1 xt +2 D +3 xt D + ut ,其中xt为定量变量;D为

8、定性变量。当 D = 0或1时,上述模型可表达为,1 xt + Ut ,2 ) + ( 1 +3)Xt + Ut , (D = 1)(D = 0)可判断模型斜率是否发生变化。通过检验 3是否为零,图8.5情形1 (不同类别数据的截距和斜率不同)图8.6情形2 (不同类别数据的截距和斜率不同)例2 :用虚拟变量区别不同历史时期( file: case2及case2-solve)中国进出口贸易总额数据(1950-1984)见上表。试检验改革前后该时间序列的斜率是 否发生变化。定义虚拟变量D如下-0( 1950 - 1977)D =-c 1( 1978 - 1984)中国进出口贸易总额数据(1950

9、-1984)(单位:百亿元人民币)年tradeTDT *D年tradeTDT*D19500.41510019681.085190019510.59520019691.069200019520.64630019701.129210019530.80940019711.209220019540.84750019721.469230019551.09860019732.205240019561.08770019742.923250019571.04580019752.904260019581.28790019762.641270019591.493100019772.725280019601.284

10、110019783.5502912919610.908120019794.5463013019620.809130019805.6383113119630.857140019817.3533213219640.975150019827.7133313319651.184160019838.6013413419661.2711700198412.0103513519671.1221800以时间T=time为解释变量,进出口贸易总额用trade表示,估计结果如下:trade = 0.37 + 0.066 time - 33.96D + 1.20 time D(1.86)(5.53)(-10.98)

11、(12.42)0.37 + 0.066 time(D = 0, 1950 - 1977)千亿港元)的拟合( file: case3及case3-solve)-33.59 + 1.27 time(D = 1, 1978 - 1984)上式说明,改革前后无论截距和斜率都发生了变化 。进出口贸易总额的年平均增长量扩大了 18倍。【案例3】香港季节GDP数据(单位:19901997年香港季度 GDP呈线性增长。1997年由于遭受东南亚金融危机的影响,经 济发展处于停滞状态,19982002年底GDP总量几乎没有增长(见上图)。对这样一种先增长后停滞,且含有季节性周期变化的过程简单地用一条直线去拟合显然

12、是不恰当的。为区别不同季节,和不同时期,定义季节虚拟变量D2、D3、D4和区别不同时期的虚拟变量DT如下(数据见附录):M (第2季度)D2 =弋L 0(其他季度)1 (第3季度)D3 =0(其他季度)M (第4季度)D4 = yL 0(其他季度)1(1998:12002:4)DT =- 匚 0(1990:1 1997:4)得估计结果如下:GDPt = 1.1573 + 0.0668t + 0.0775D2 + 0.2098D3 + 0.2349D4+ 1.8338 DT- 0.0654 DTt(50.8)(64.6)(3.7)(9.9)(11.0)(19.9)(-28.0)R2 = 0.99, DW = 0.9, s.e. = 0.05, F=1198.4, T=52, t0.05 (52-7) = 2.01对于 1990:1 1997:4GDPt = 1.1573 + 0.0668 t + 0.0775 D2 + 0.2098 D3 + 0.2349 D4对于 1998:12002:4GDPt = 2.9911 + 0.0014 t + 0.0775 D2 + 0.2098 D3 + 0.2349 D4Dependent Variable: GDPMethod: Least SquaresDate 0M4

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号