计量经济学(回归模型的扩展-虚拟变量部分)

上传人:F****n 文档编号:88226565 上传时间:2019-04-21 格式:PPT 页数:37 大小:430KB
返回 下载 相关 举报
计量经济学(回归模型的扩展-虚拟变量部分)_第1页
第1页 / 共37页
计量经济学(回归模型的扩展-虚拟变量部分)_第2页
第2页 / 共37页
计量经济学(回归模型的扩展-虚拟变量部分)_第3页
第3页 / 共37页
计量经济学(回归模型的扩展-虚拟变量部分)_第4页
第4页 / 共37页
计量经济学(回归模型的扩展-虚拟变量部分)_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《计量经济学(回归模型的扩展-虚拟变量部分)》由会员分享,可在线阅读,更多相关《计量经济学(回归模型的扩展-虚拟变量部分)(37页珍藏版)》请在金锄头文库上搜索。

1、第三章 回归模型的扩展 之 虚拟变量,第四节 虚拟变量模型,一、虚拟变量的概念 二、虚拟变量引入的方式 三、虚拟变量的引入原则 四、虚拟变量的应用 五、案例分析,一、虚拟变量的概念 1、问题的引出,前面的回归模型中,所遇到的变量均为定量变量,如GDP、工资、收入、销售额,教育年数等。 实际建模,一些定性变量有不可忽视的影响。 例如,研究某个企业的销售水平,产业属性(制造业、零售业)、所有制(私营,非私营)、地理位置(东、中、西部)等是值得考虑的因素。但这些因素是定性描述的。,2、基本概念,定量因素可直接测度,数值性的因素 定性因素属性因素,表征某种属性存在与否的非数值性因素 问题:能否将定性因

2、素进行量化,以及如何引入模型中? 离散选择模型(离散被解释变量) 虚拟变量方法(离散解释变量),3、虚拟变量的定义,计量经济学中,将取值0和1的人工变量称为虚拟变量、哑元变量,定性变量。(dummy variable) 通常用D表示 对定性变量的量化,以及对定量变量的分类,都可以采用虚拟变量的方式进行。,例如,反映文化程度的虚拟变量可取为:,本科及以上 本科以下,男性 女性,反映性别的虚拟变量可取为:,4、虚拟变量中“0”,“1”选取原则 要从分析问题的目的出发予以界定 0代表基期,比较的基期,参照组 1代表报告期,被比较的效应,实验组,二、虚拟变量引入方式,虚拟变量做为解释变量引入模型有两种

3、基本方式:加法方式和乘法方式。,企业男职工的平均薪金为:,企业女职工的平均薪金为:,加法方式 (1)单个虚拟变量的引入:一种因素两种状态 例:研究工龄、性别对员工工资的影响,其中:Yi为企业职工的薪金, Xi为工龄,,男性 女性,几何意义:,两个函数有相同的斜率,说明男女职工平均薪金对工龄的变化率是一样的。 如果20,表明两个函数截距不相同,且男职工平均薪金比女职工高,两者平均薪金水平相差2。 如果20,表明两个函数截距不相同,且男职工平均薪金比女职工低,两者平均薪金水平相差2。 如果20,表明两个函数截距相同,即男职工,女职工的平均薪金没有显著差异。,可以通过传统的回归检验,对2的统计显著性

4、进行检验,以判断企业男女职工的平均薪金水平是否有显著差异。,0,2,例:研究收入和教育水平(分为高,中,低三类)对个人保健支出的影响。,教育水平考虑三个层次: 低学历:高中以下, 中等学历:高中,及大中专 高学历:大学及其以上。,这时需要引入两个虚拟变量:,(2)多个虚拟变量的设定和引入 一种因素多种状态(水平):,模型可设定如下:,在E(i)=0 的初始假定下,低学历,中等学历,高学历教育水平下个人保健支出的函数:,低学历: 中等学历: 高学历,假定32,其几何意义:,问题: 虚拟变量为何只选“0”, 1“,选择0,1,2 等可以吗 同一种属性,两个变量能够表示几种状态? 思考,如果在模型中

5、引入季节效应?月份效应?,(3)多个虚拟变量的引入多种因素,例:研究学历(本科及以上,本科以下),性别(男、女)对员工工资的影响。 在例1基础上,再引入代表学历的虚拟变量D2:,本科及以上学历 本科以下学历,职工薪金的回归模型可设计为:,女职工本科以下学历的平均薪金:,女职工本科以上学历的平均薪金:,于是,不同性别、不同学历职工的平均薪金分别为:,男职工本科以下学历的平均薪金:,男职工本科以上学历的平均薪金:,思考:研究性别(男、女),学历(分为高学历,中等学历,低学历)对员工工资的影响。一共要引入几个虚拟变量?,注意:加法方式引入虚拟变量,考察了截距的不同。 但同时注意到,此时不同性别的人的

6、学历差距对工资的影响一样。这是一个较强的约束。 有可能当学历不同时,性别对于工资的影响不同 或者,性别不同时,学历对工资的影响不同 即:某变量的边际影响受到其他变量的调节作用。如何体现这种交互效应?,交互效应的处理 一个解释变量的边际效应有时可能要依赖于另一个解释变量。 交互作用的引入方法:在模型中引入相关变量的乘积。 交互项的处理方法,对于数量变量和虚拟变量都适用,例:研究工龄、性别,学历对工资的影响(包含性别和学历的交互项)对工资的影响。 此时,男性高学历的工作方程是怎样的? 如何检验交互效应是否存在?,2. 乘法方式,乘法方式引入虚拟变量时,将虚拟变量与其他解释变量(或者定量变量X,或者

7、其他虚拟变量D)的乘积,作为新的解释变量出现在模型中。 达到调整设定模型斜率的目的。,背景介绍:根据消费理论,消费水平C主要取决于收入水平Y,但在一个较长的时期,人们的消费倾向会发生变化,尤其是在自然灾害、战争等反常年份,消费倾向往往出现变化。 例:利用1978-2001年的数据,分析1990年前后消费倾向是否发生变化?,消费模型可建立如下:,这里,虚拟变量D以与X相乘的方式引入了模型中,从而可用来考察消费倾向的变化。 假定E(i)= 0,上述模型所表示的函数可化为:,1990年后:,1990年前:,3、当截距与斜率发生变化时,同时引入加法与乘法形式的虚拟变量,例,利用1978-2001的居民

8、储蓄与居民收入的数据。考察1990年前、后中国居民的总储蓄-收入关系是否已发生变化。,储蓄收入关系是否发生改变,可利用虚拟变量模型来解决。,将1990年前与1990年的观测值合并,并用以估计以下回归:,Di为引入的虚拟变量:,90年后 90年前,于是有:,可分别表示1990年前与1990年后的储蓄函数。,在统计检验中, 如果3=0的假设被拒绝,则说明两个时期中储蓄函数的截距不同;(t检验) 如果4=0的假设被拒绝,则说明两个时期中储蓄函数的斜率不同。(t检验),三、虚拟变量的引入原则,若定性因素具有m个(m2)个相互排斥的属性(或水平) 当回归模型有截距项时,只能引入 m-1 个虚拟变量 当回

9、归模型无截距项时,可引入m个虚拟变量 否则就会陷入“虚拟变量陷阱”,例:虚拟变量陷阱 居民住房消费支出和居民可支配收入之间的数量关系的回归模型为: 为了研究“城镇”和“农村”在住房消费上的支出差异,引入虚拟变量:,城镇 农村,城镇 农村,如果引入两个虚拟变量: 回归模型为: 对任意家庭都有: 产生完全多重共线性,陷入“虚拟变量陷阱” 虚拟变量陷阱的实质是:完全多重共线性,城镇 农村,农村 城镇,如果模型本身不含截距项,引入两个虚拟变量: 回归模型为: 不会产生产生完全多重共线性,即不会陷入“虚拟变量陷阱”,城镇 农村,农村 城镇,四、虚拟变量的应用,(1)调整季节波动 利用季度或月份资料建模时,经常存在季节波动。 处理方法 去除时间序列的季节、周期等效应,更清晰的反应变量之间的关系 利用虚拟变量方法反映季节因素的影响,三、虚拟变量的应用,(2)检验模型结构的稳定性(变化) 用途: 分析模型结构对样本变化的敏感性 比较两个或多个模型之间的差异情况 例如,不同性别人群消费函数是否相同?不同时期居民消费行为是否发生变化? 为什么不简单的将数据分成两段? 分组后观测值大大减少,有时观测值少到难以估计 无法对结构变化进行检验,(3)分段回归(略),五、案例分析,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号