计量经济学第八章 虚拟变量回归

上传人:飞*** 文档编号:49133662 上传时间:2018-07-24 格式:PPT 页数:39 大小:342.50KB
返回 下载 相关 举报
计量经济学第八章 虚拟变量回归_第1页
第1页 / 共39页
计量经济学第八章 虚拟变量回归_第2页
第2页 / 共39页
计量经济学第八章 虚拟变量回归_第3页
第3页 / 共39页
计量经济学第八章 虚拟变量回归_第4页
第4页 / 共39页
计量经济学第八章 虚拟变量回归_第5页
第5页 / 共39页
点击查看更多>>
资源描述

《计量经济学第八章 虚拟变量回归》由会员分享,可在线阅读,更多相关《计量经济学第八章 虚拟变量回归(39页珍藏版)》请在金锄头文库上搜索。

1、计量经济学 第 八 章 虚拟变量回归 1问题的一般性描述 在前面讨论的回归模型中,所遇的变量均为定量变量 (可直接测度、数值性),例如GDP,工资,收入、 受教育年数,销售额等。 在实际建模中,一些定性变量具有不可忽视的重 要影响。例如,研究某个企业的销售水平,产业属性 (制造业、零售业)、所有制(私营、非私营)、地 理位置(东、中、西部)、管理者的素质、不同的收 入水平等是值得考虑的重要影响因素,但这些因素共 同的特征是定性描述的。在同时考虑定量和定性因素的条件下,依据现有 的回归分析知识,如何对非定量因素进行回归分析? 采用“虚拟变量”对定性变量进行量化是一种思路。2第一节 虚拟变量一、基

2、本概念 定量因素:可直接测度、数值性的因素。 定性因素:属性因素,表征某种属性存在与否的非数值性的因素。 基本思想:直接在回归模型中加入定性因素存 在诸多的困难,是否可将这些定性因素进行量化 ,以达到定性因素能与定量因素有着相同作用 之目的。3对定性变量的量化可采用虚拟变量的方式实 现计量经济学中,将取值为0 和 1的人工变量 称为虚拟变量。虚拟变量的同位语有:哑元 变量、定性变量等等。通常用字母 D或 DUM 加以表示(英文中虚拟或者哑元 Dummy 的缩 写)。虚拟变量的定义4虚拟变量的设置规则涉及三个方面:1、 “0”和“1”选取原则;2、属性(状态、水平)因素与设置虚拟变量 数量的关系

3、;3、虚拟变量在回归分析中的角色以及作用等 方面的问题。二、虚拟变量设置规则51、虚拟变量的“0”和“1”选取原则 虚拟变量取“1”或“0”的原则,应从分析 问题的目的出发予以界定。 从理论上讲,虚拟变量取“0”值通常代表比 较的基础类型;而虚拟变量取“1”值通常代表 被比较的类型。 “0”代表基期(比较的基础,参照物); “1”代表报告期(被比较的效应)。6例如,比较收入时考察性别定性变量的作用。 当研究男性收入是否高于女性时,是将女性作 为比较的基础(参照物),故有男性为“1”, 女性为“0”。7定性因素的属性既可能为两种状态,也可能 为多种状态。例如,性别(男、女两种)、 季节(4种状态

4、),地理位置(东、中、西部 ),行业归属,所有制,收入的分组等。2、属性的状态(水平)数与虚拟变量数量的关系891、若定性因素具有m 个(m=2,3,4等)相互排 斥属性(或几个水平),当回归模型有截距项时 ,只能引入 m-1 个虚拟变量;2、当回归模型无截距项时,则可引入 m 个虚 拟变量;否则,就会陷入“虚拟变量陷阱”。为什么?虚拟变量数量的设置规则10研究居民住房消费支出Yi和居民可支配收入 Xi 之间的数量关系。回归模型的设定为:现在要考虑城镇居民和农村居民之间的差异,如何办?一个例子(虚拟变量陷阱)为了对 “城镇居民”、“农村居民”进行区分,分析各自 在住房消费支出 Yi 上的差异,

5、设(模型有截距,“居民属性”定性变量只有两个相互排斥的属 性状态(m=2),故只设定一个虚拟变量。)则模型为11则模型(1)为这时,对任一家庭都有:D1+D2=1,即 D1+ D2 1= 0 产生完全共线,陷入了“虚拟变量陷阱”,。若对两个相互排斥的属性 “居民属性” ,仍然引入 m=2 个虚拟变量,则有“虚拟变量陷阱”的实质是:完全多重共线性。12 虚拟变量既可作为被解释变量,也可作为解释变量,分别称其为虚拟被解释变量和虚拟解释变量。虚拟被解释变量的研究是当前计量经济学研究的前沿领域,如MacFadden、Heckmen等人的微观计量经济学研究,大量涉及到虚拟被解释变量的分析。本课程只是讨论

6、虚拟解释变量的问题3、虚拟变量在回归模型中的角色13第二节 虚拟解释变量的回归在计量经济学中,通常引入虚拟变量的方式分 为加法方式和乘法方式两种:即实质:加法方式引入虚拟变量改变的是截距; 乘法方式引入虚拟变量改变的是斜率。14一、加法类型n 一个以性别为虚拟变量考察企业职工薪金的模型 :其中:Yi为企业职工的薪金,Xi为工龄,Di=1,若是男性,Di=0,若是女性。企业男职工的平均薪金为:上述企业职工薪金模型中性别虚拟变量的引入采 取了加法方式。在该模型中,如果仍假定E(i)=0,则企业女职工的平均薪金为:15几何意义:n假定20,则两个函数有相同的斜率,但有不同 的截距。即,男女职工平均薪

7、金对工龄的变化率是 一样的,但两者的平均薪金水平相差2。n可以通过传统的回归检验,对2的统计显著性进 行检验,以判断企业男女职工的平均薪金水平是否 有显著差异。0216又例:在横截面数据基础上,考虑个人保健支出 对个人收入和教育水平的回归。教育水平考虑三个层次: 高中以下,高中,大学及其以上 模型可设定如下:这时需要引入两个虚拟变量:17在E(i)=0 的初始假定下,高中以下、高中、大学 及其以上教育水平下个人保健支出的函数:n高中以下:高中:大学及其以上:假定32,其几何意义:18 还可将多个虚拟变量引入模型中以考察多种“定性 ”因素的影响。如在上述职工薪金的例中,再引入代表学历的虚拟 变量

8、D2:本科及以上学历本科以下学历职工薪金的回归模型可设计为:19女职工本科以下学历的平均薪金:女职工本科以上学历的平均薪金:于是,不同性别、不同学历职工的平均薪金分别为:男职工本科以下学历的平均薪金:男职工本科以上学历的平均薪金:20基本思想以乘法方式引入虚拟变量时,是在所设立的模 型中,将虚拟解释变量与其它解释变量(或为 Xi 或为Di)的乘积,作为新的解释变量出现在模型 中,以达到其调整设定模型斜率系数的目的。或 者将模型斜率系数表示为虚拟变量的函数,以达 到相同的目的。二、乘法类型乘法引入方式可分为两种情形讨论 (1)截距不变; (2)截距和斜率均发生变化;21(1)截距不变的情形模型形

9、式:例:研究消费支出 Y 受到收入 X、年份状况 D 的影响。22(2)截距和斜率均发生变化模型形式:例,同样研究消费支出 Y 、收入 X、年份状况 D 间的 影响关系。比较:发生了那些变化? 23不同截距、斜率的组合图形重合回归:截距斜率均相同平行回归:截距不同斜率相同共点回归:截距相同斜率不同交叉(不同)回归:截距斜率均不同24三、虚拟解释变量综合应用所谓综合应用是指将引入虚拟解释变量的加法方式、 乘法方式进行综合使用。本课主要讨论:(1)虚变量在模型结构稳定性检验中的应用;(2)虚变量在分段回归中的应用;(3)虚变量在季节调整中的应用;25(1)虚变量在模型结构稳定性检验中的应用结构变化

10、的实质是检验所设定的模型在样本期内 是否为同一模型。显然,平行回归、共点回归、 交叉回归三个模型均不是同一模型。平行回归模型的假定是斜率保持不变(加法类型 ,包括方差分析);共点回归模型的假定是截距保持不变(乘法类型 ,又被称为协方差分析);交叉回归模型的假定是截距、斜率均为变动的( 加法、乘法类型的组合)。26n Philips在研究英国的劳动工资率和失业率之间的关系时发现:劳动工资率和失业率之间具有双曲线性质,即劳动工资增加,失业率就降低,劳动工资率减少,失业率增加,这些关系可用Philips曲线来描述。然而,随着时间序列数据样本容量的增加,经济学家发现劳动工资率与失业率之间的凸双曲线关系

11、被否定了,也就是说经典的Philips曲线不能作为有效政策制定的理论依据了。27根据19581977年期间美国小时收入指数变化的百 分比即小时劳动工资率与失业率的时间序列数据,建 立以下回归模型:其中Y表示劳动工资率,X表示失业率,D为虚拟变量 且其定义为*28得到模型(*)的回归结果如下:回归方程的拟和非常低,但是回归模型的参数t检验却 非常之显著。由此,得出数据结构复杂程度是非常明 显的。29根据Di的定义,可得30XYPhilips曲线结构分析 (1958-1977)31从图就可看出回归模型(*)是结构不稳定的,并且造成这个结构不稳定的主要原因是1970-1977年的时间序列数据并不支持

12、经典的Philips曲线,也就是说Philips曲线的结构发生了变化。由此告诉人们,根据1958-1977年期间美国的小时劳动工资年均变化率和数据直接作回归分析是不可靠的,原因是回归模型(*)存在结构不稳定问题。32作用: 提高模型的描述精度。 虚拟变量也可以用来代表数量因素的不同阶段。分段 线性回归就是类似情形中常见的一种。一个例子 研究不同时段我国居民的消费行为。 实际数据表明,1979年以前,我国居民的消费支出Yt呈缓慢上升的趋势;从1979年开始,居民消费支出为快速上升趋势。如何刻画我国居民在不同时段的消费行为?(2)虚变量在分段回归中的应用33基本思路:采用乘法方式引入虚拟变量的手段

13、。显然,1979年是一个转折点,可考虑在这个转折点作为虚拟变量设定的依据。若设 X*1979,当 t X* 时可引入虚拟变量。34(t1955,1956,2006)居民消费趋势方程:依据上述思路,有如下描述我国居民在不同时段消费行为模型:35分析: 1979年之前,回归模型的斜率为1; 1979年之后,回归模型的斜率为1+2;若统计检验表明,2 显著不为零,则我国居 民的消费行为在1979年前后发生了明显改变。X*XY36(3)虚变量在季节调整中的应用n 例如:啤酒销售量Y、人均收入X、季节D;其模 型为:37()一季度二季度三季度四季度比较的基础四季度38运用 OLS 得到回归结果,再用 t-检验讨论季节因素是否对模型有影响。EViews命令:Ls y c x seas(1) seas(2) seas(3)39

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 教育/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号