第七章 虚拟变量回归.doc

上传人:枫** 文档编号:548377621 上传时间:2023-06-24 格式:DOC 页数:21 大小:1.07MB
返回 下载 相关 举报
第七章 虚拟变量回归.doc_第1页
第1页 / 共21页
第七章 虚拟变量回归.doc_第2页
第2页 / 共21页
第七章 虚拟变量回归.doc_第3页
第3页 / 共21页
第七章 虚拟变量回归.doc_第4页
第4页 / 共21页
第七章 虚拟变量回归.doc_第5页
第5页 / 共21页
点击查看更多>>
资源描述

《第七章 虚拟变量回归.doc》由会员分享,可在线阅读,更多相关《第七章 虚拟变量回归.doc(21页珍藏版)》请在金锄头文库上搜索。

1、第七章 虚拟变量回归第一节 虚拟变量的性质在实际建模过程中,被解释变量不但受定量变量影响,同时还受定性变量影响。例如需要考虑性别、民族、不同历史时期、季节差异、政府的更迭(工党-保守党)、经济体制的改革、固定汇率变为浮动汇率、从战时经济转为和平时期经济等。这些因素也应该包括在模型中。一、基本概念由于定性变量通常表示的是某种特征的有和无,所以量化方法可采用取值为1或0。这种变量称作虚拟变量(dummy variable)。虚拟变量也称:哑元变量、定性变量等等。通常用字母D或DUM加以表示(英文中虚拟或者哑元Dummy的缩写)。用1表示具有某一“品质”或属性,用0表示不具有该“品质”或属性。虚拟变

2、量使得我们可以将那些无法定量化的变量引入回归模型中。虚拟变量应用于模型中,对其回归系数的估计与检验方法和定量变量相同。虚拟变量表示两分性质,即“是”或“否”,“男”或“女”等。下面给出几个可以引入虚拟变量的例子。例1:你在研究学历和收入之间的关系,在你的样本中,既有女性又有男性,你打算研究在此关系中,性别是否会导致差别。例2:你在研究某省家庭收入和支出的关系,采集的样本中既包括农村家庭,又包括城镇家庭,你打算研究二者的差别。例3:你在研究通货膨胀的决定因素,在你的观测期中,有些年份政府实行了一项收入政策。你想检验该政策是否对通货膨胀产生影响。上述各例都可以用两种方法来解决,一种解决方法是分别进

3、行两类情况的回归,然后看参数是否不同。另一种方法是用全部观测值作单一回归,将定性因素的影响用虚拟变量引入模型。二、虚拟变量设置规则虚拟变量的设置规则涉及三个方面:1.“0”和“1”选取原则虚拟变量取“1”或“0”的原则,应从分析问题的目的出发予以界定。从理论上讲,虚拟变量取“0”值通常代表比较的基础类型;而虚拟变量取“1”值通常代表被比较的类型。 “0”代表基期(比较的基础,参照物);“1”代表报告期(被比较的效应)。例如,比较收入时考察性别的作用。当研究男性收入是否高于女性时,是将女性作为比较的基础(参照物),故有男性为“1”,女性为“0”。2.属性(状态、水平)因素与设置虚拟变量数量的关系

4、定性因素的属性既可能为两种状态,也可能为多种状态。例如,性别(男、女两种)、季节(4种状态),地理位置(东、中、西部),行业归属,所有制,收入的分组等。 虚拟变量数量的设置规则1.若定性因素具有 m(m2) 个相互排斥属性(或几个水平),当回归模型有截距项时,只能引入m个虚拟变量;2.当回归模型无截距项时,则可引入m个虚拟变量;否则,就会陷入“虚拟变量陷阱”。例 (虚拟变量陷阱)研究居民住房消费支出 和居民可支配收入xi 之间的数量关系。回归模型的设定为:现在要考虑城镇居民和农村居民之间的差异,如何办?为了对 “城镇居民”、“农村居民”进行区分,分析各自在住房消费支出 上的差异,设 为城镇;

5、为农村。 ,则模型为(模型有截距,“居民属性”定性变量只有两个相互排斥的属性状态( m=2),故只设定一个虚拟变量。)若对两个相互排斥的 “居民属性” ,引入m=2个虚拟变量,则有则模型(1)为 则对任一家庭都有: D1+D2=1 即产生完全共线,陷入了“虚拟变量陷阱”。“虚拟变量陷阱”的实质是:完全多重共线性。第二节 虚拟解释变量的回归在计量经济学中,通常引入虚拟变量的方式分为加法方式和乘法方式两种:即原模型 实质:加法方式引入虚拟变量改变的是截距;乘法方式引入虚拟变量改变的是斜率。一、加法类型(1)一个两种属性定性解释变量而无定量变量的情形例:按性别划分的教授薪金序号起薪,Y(千美元)性别

6、(男=1,女=0)122121903180421.71518.506211720.518170917.501021.21Dependent Variable: YMethod: Least SquaresDate: 11/23/11 Time: 22:19Sample: 1 10Included observations: 10VariableCoefficientStd. Errort-StatisticProb.C18.000000.31176957.735030.0000D3.2800000.4409087.4391910.0001R-squared0.873701Mean depend

7、ent var19.64000Adjusted R-squared0.857913S.D. dependent var1.849444S.E. of regression0.697137Akaike info criterion2.293187Sum squared resid3.888000Schwarz criterion2.353704Log likelihood-9.465934F-statistic55.34156Durbin-Watson stat0.667284Prob(F-statistic)0.000073Yi = 18 + 3.28 Di薪金女教授男教授(2)包含一个定量变

8、量,一个定性变量模型设有模型,yt = b0 + b1 xt + b2D + ut ,其中yt,xt为定量变量;D为定性变量。当D = 0 或1时,上述模型可表达为, b0 + b1xt + ut , (D = 0) yt = (b0 + b2) + b1xt + ut , (D = 1) D = 1或0表示某种特征的有无。反映在数学上是截距不同的两个函数。若b2显著不为零,说明截距不同;若b2为零,说明这种分类无显著性差异。例:中国成年人体重y(kg)与身高x(cm)的回归关系如下: 105 + x D = 1 (男) y = - 100 + x - 5D = 100 + x D = 0 (

9、女)注意: 关于定性变量中的哪个类别取0,哪个类别取1,是任意的,不影响检验结果。但解释模型时一定注意1,0是怎样分配的。定性变量中取值为0所对应的类别称作基础类别(base category)。 对于多于两个类别的定性变量可采用设一个虚拟变量而对不同类别采取赋值不同的方法处理。如: 1 (大学) D = 0 (中学) -1 (小学)。(3)一个定性解释变量(两种以上属性)和一个定量解释变量的情形(4)两个定性解释变量(均为两种属性)和一个定量解释变量的情形例:研究大学教师的年薪是否受到性别、学历的影响。性别和学历是两个不同的标准。按性别标准教师可以分成男、女两类,应该引入一个虚拟变量;按学历

10、标准大学教师可以分为大学本科学历、硕士学历、博士学历三类,应该引入两个虚拟变量,共引入三个虚拟变量: 令Y代表年薪, X代表教龄,建立模型:可以看出基准类是本科女教师,B0为刚参加工作的本科女教师的工资;B1为参加工作时间对工资的影响;B2是性别差异系数;B3和B4为学历差异系数,B3是硕士学历与本科学历的收入差异,B4是博士学历与本科学历的收入差异;通过上述分析,我们可以确定Bi的符号。在这个问题中,一共有六个类别,但是我们只引入了三个虚拟变量,而不是五个。 在就多个标准引入虚拟变量时,应该注意每一标准下引入虚拟变量个数应该是这一标准下类别数目减一,所以我们在本例中只引入三个虚拟变量而不是五

11、个。如果引入五个虚拟变量就会陷入虚拟变量陷阱。运用OLS得到回归结果,再用t检验讨论因素 是否对模型有影响。加法方式引入虚拟变量的主要作用为: 1.在有定量解释变量的情形下,主要改变方程截距; 2.在没有定量解释变量的情形下,主要用于方 差分析。二、乘法类型基本思想以乘法方式引入虚拟变量时,是在所设立的模型中,将虚拟解释变量与其它解释变量的乘积,作为新的解释变量出现在模型中,以达到其调整设定模型斜率系数的目的。或者将模型斜率系数表示为虚拟变量的函数,以达到相同的目的。乘法引入方式: (1)截距不变; (2)截距和斜率均发生变化;分析手段:仍然是条件期望。以上只考虑定性变量影响截距,未考虑影响斜

12、率,即回归系数的变化。当需要考虑时,可建立如下模型: yt = b0 + b1 xt + b2 D + b3 xt D + ut ,其中xt为定量变量;D为定性变量。当D = 0 或1时,上述模型可表达为, (b0 + b2 ) + (b1 + b3)xt + ut , (D = 1) yt = b0 + b1 xt + ut , (D = 0) 通过检验 b3是否为零,可判断模型斜率是否发生变化。情形1(不同类别数据的截距和斜率不同) 情形2(不同类别数据的截距和斜率不同)例:用虚拟变量区别不同历史时期(file:dummy2)中国进出口贸易总额数据(1950-1984)见下表。试检验改革前

13、后该时间序列的斜率是否发生变化。定义虚拟变量D如下 0 (1950 - 1977) D = 1 (1978 - 1984)中国进出口贸易总额数据(1950-1984) (单位:百亿元人民币)年tradetimeDtime D年tradetimeDtime D19500.41510019681.085190019510.59520019691.069200019520.64630019701.129210019530.80940019711.209220019540.84750019721.469230019551.09860019732.205240019561.08770019742.923250019571.04580019752.9042600195

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号