第八部分虚拟变量模型

上传人:012****78 文档编号:125777780 上传时间:2020-03-20 格式:PPT 页数:56 大小:723.50KB
返回 下载 相关 举报
第八部分虚拟变量模型_第1页
第1页 / 共56页
第八部分虚拟变量模型_第2页
第2页 / 共56页
第八部分虚拟变量模型_第3页
第3页 / 共56页
第八部分虚拟变量模型_第4页
第4页 / 共56页
第八部分虚拟变量模型_第5页
第5页 / 共56页
点击查看更多>>
资源描述

《第八部分虚拟变量模型》由会员分享,可在线阅读,更多相关《第八部分虚拟变量模型(56页珍藏版)》请在金锄头文库上搜索。

1、单击此处编辑母版标题样式 1 单击此处编辑母版副标题样式 计计量经济经济 学 理论论 方法 EViews应应用 郭存芝 杜延军军 李春吉 编编著 电子教案 本章将主要介绍经典单方程计量经济学模型中引入虚拟变量的问题 第八章 虚拟变量模型 在前面几章中 主要介绍了经典线性回归模型及其在若干基本假定 下的估计问题 并分析了一个或多个假定不满足时所产生的后果及其可 能的改进措施 然而上述方法还不能解决经济生活中遇到的全部问题 如何考察某一突发事件 性别 季节 受教育程度等对经济行为带 来的影响 例如 第八章 虚拟变量模型 学习目的 了解虚拟变量 虚拟变量模型的概念 掌握虚拟变量设置的 原则和引入模型

2、的方法 基本要求 1 认识到虚拟变量是建立计量经济学模型经常会遇到的问题 2 了解虚拟变量 虚拟变量模型的概念 3 掌握虚拟变量设置的原则 虚拟变量模型的建模方法及应用 虚拟变量 虚拟变量模型 第八章 虚拟变量模型 第一节 虚拟变量 虚拟变量的引入 虚拟变量的设置原则 一 虚拟变量 为什么要引入 虚拟变量 如商品需求量 价格 收入 产量等 许多经济变量是可以定量度量的或者说是可以直接观测的 但是也有一些影响经济变量的因素无法定量度量或者说无法直接观测 如职业 性别对收入的影响 战争 自然灾害对GDP的影响 季节 对某些产品 如冷饮 销售的影响等 为了能够在模型中反映这些因素的影响 并提高模型的

3、精度 需要将 它们人为地 量化 这种 量化 通常是通过引入 虚拟变量 来完成的 这种用两个相异数字来表示对被解释变量有重要影响而自身又 没有观测数值的一类变量 称为虚拟变量 dummy variables 虚拟变量也称为哑变量或定性变量 虚拟变量的特点是 1 虚拟变量是对经济变化有重要影响的不可测变量 2 虚拟变量是赋值变量 一般根据这些因素的属性类型 构造只取 0 或 1 的人工变量 通常称为虚拟变量 记为D 这是为了便于计算而 把定性因素这样数量化的 所以虚拟变量的数值只表示变量的性质而不表 示变量的数值 基础类型和肯定类型取值为1 一般地 在虚拟变量的设置中 比较类型和否定类型取值为0

4、例如 1 表示性别的虚拟变量可取为 D1 1 男性 0 女性 2 表示文化程度的虚拟变量可取为 D2 1 本科及以上学历 0 本科以下学历 3 表示地区的虚拟变量可取为 D3 1 城市 0 农村 4 表示消费心理的虚拟变量可取为 D4 1 喜欢某种商品 0 不喜欢某种商品 5 表示天气变化的虚拟变量可取为 D5 0 雨天 1 晴天 二 虚拟变量模型 同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型 在模型中 虚拟变量可作为解释变量 也可作为被解释变量 但主要 是用作解释变量 一个以性别为虚拟变量来考察职工薪金的模型如下 8 1 其中 例如 为职为职 工的薪金 为职为职 工工龄龄 1 代表男

5、性 0 代表女性 三 虚拟变量的引入 虚拟变量作为解释变量引入模型有两种基本方式 加法方式和乘法方式 1 加法方式 上述职工薪金模型 8 1 中性别虚拟变量的引入就采取了加法方式 女职职工的平均薪金为为 在该该模型中 如果仍假定 0 则 男职工的平均薪金为 从几何意义上看 图8 1 图8 1 男女职工平均薪金示意图 假定 0 则两个函数有相同的斜率 但有不同的截距 这这意味着 男女职职工平均薪金对对工龄龄的 变化率是一样的 但两者的平均薪金水平相 差 可以通过传统过传统 的回归检验归检验 对对 的统计显统计显 著性进进行检验检验 以判断男女 职工的平均薪金水平是否有显著差异 例如 在截面数据基

6、础上 考虑个人保健支出对个人收入和教育水平的回归 教育水平考虑三个层次 高中以下 高中 大学及其以上 D1 1 高中 0 其它 D2 1 大学及其以上 0 其它 这时需要引入两个虚拟变量 模型可设定如下 8 2 高中以下 E Yi Xi D1i 0 D2i 0 0 1Xi 高中 大学及其以上 E Yi Xi D1i 1 D2i 0 0 2 1Xi E Yi Xi D1i 0 D2i 1 0 3 1Xi 在 0的初始假定下 容易得到高中以下 高中 大学及其以上 教育水平个人平均保健支出的函数 假定 且 则则其几何意义义如图图8 2所示 图8 2 不同教育程度人员保健支出示意图 还可将多个虚拟变量

7、引入模型中以考察多种 定性 因素的影响 例如 在职工薪金模型 8 1 的例子中 再引入学历的虚拟变量 D2 1 本科及以上学历 0 本科以下学历 则职工薪金的回归模型可设计如下 8 3 Yi 0 1Xi 2Di 3D2i i 于是 不同性别 不同学历职工的平均薪金分别由下面各式给出 女职工本科以下学历的平均薪金 男职工本科以下学历的平均薪金 女职工本科以上学历的平均薪金 男职工本科以上学历的平均薪金 E Yi Xi D1i 0 D2i 0 0 1Xi E Yi Xi D1i 1 D2i 0 0 2 1Xi E Yi Xi D1i 0 D2i 1 0 3 1Xi E Yi Xi D1i 1 D2

8、i 1 0 2 3 1Xi 2 乘法方式 斜率的变化 例如 根据消费理论 消费水平C主要取决于收入水平X 但在一个较长的 时期 人们的消费倾向会发生变化 尤其是在自然灾害 战争等反常年 份 消费倾向往往出现变化 这种消费倾向的变化可通过在收入的系数 中引入虚拟变量来考察 设 Dt 1 正常年份 0 反常年份 则消费模型可建立如下 8 4 这里 虚拟变量 Dt 以与 Xt 相乘的方式引入了模型中 从而可用来 考察消费倾向的变化 在E t 0的假定下 上述模型所表示的函数可化为 正常年份 反常年份 图8 3 不同年份消费倾向示意图 假定 0 则其几何图形如图8 3所示 如果在模型中同时使用加法和乘

9、法两种方式引入虚拟变量 则回归线的截距和斜率都会改变 例如 对于改革开放前后储蓄 收入模型 可设定为 8 5 其中 Y为储蓄 X为收入 Dt为虚拟变量 Dt 1 改革开放以后 0 改革开放以前 显然在式 8 5 中 同时使用加法和乘法两种方式引入了虚拟变量 在E t 0的假定下 上述模型所表示的函数可化为 改革开放以前 E Yt Xt Dt 0 0 1Xt 改革开放以后 则则其几何图图形如图图8 4所示 E Yt Xt Dt 1 0 1 1 2 Xt 假定 0且0 改革开放以前 改革开放以后 X Y 图8 4 改革开放前后储蓄函数示意图 3 临界指标的虚拟变量的引入 在经济发生转折时 可通过建

10、立临界指标的虚拟变量模型来反映 例如 进口消费品数量Y主要取决于国民收入X的多少 中国在改革开放前后 Y对X的回归关系明显不同 这时 可以t 1979为转折期 以1979年的国民收入Xt 为临界值 设如下虚拟变量 1 0 Dt t t t t 则进口消费品的回归模型可建立如下 8 6 如果用OLS法得到该模型的回归方程为 8 7 则两个时期进口消费品函数分别为 当t t 1979时 当t t 1979时 几何图形如图8 5所示 图8 5 转折期回归示意图 4 数值变量作为虚拟变量引入 有些变量虽然是数量变量 即可以获得实际观测值 但在某些特定情 况下把它选取为虚拟变量则是方便的 以虚变量引入计

11、量经济学模型更加 合理 譬如年龄因素虽然可以用数字计量 但如果将年龄作为资料分组的特 征 则可将年龄选作虚拟变量 例如 家庭教育经费支出不仅取决于其收入 而且与年龄因素有关 按年龄划分为三个年龄组 6 18岁年龄组 中小学教育 19 22岁 年龄组 大学教育 其它年龄组 于是设定虚拟变量 D1 1 6 18岁年龄组 0 其它 D2 1 19 22年龄组 0 其它 则家庭教育经费支出模型可设定为 8 8 其中 Yi是第i个家庭的教育经费支出 Xi是第i个家庭的收人 虚拟变量D1i D2i分别表示第i家庭中是否有6 18岁和19 22岁的成员 5 虚拟变量交互效应分析 当分析解释变量对变量的影响时

12、 大多数情形只是分析了解释变量 自身变动对被解释变量的影响作用 而没有深入分析解释变量间的相互 作用对被解释变量影响 前面讨论的分析两个定性变量对被解释变量影响的虚拟变量模型中 暗含着一个假定 两个定性变量是分别独立地影响被解释变量的 但是在实际经济活动中 两个定性变量对被解释变量的影响可能存在 一定的交互作用 即一个解释变量的边际效应有时可能要依赖于另一个解 释变量 为描述这种交互作用 可以把两个虚拟变量的乘积以加法形式引入模型 考虑下列模型 Yi 0 1D1i 2D2i Xi i 8 9 其中 Yi为农副产品生产总收益 Xi为农副产品生产投入 D1i为油菜籽生 产虚拟变量 D2i为养蜂生产

13、虚拟变量 这里 D1i 1 发展油菜籽生产 0 其它 D2i 1 发展养蜂生产 0 其它 例如 显然 8 9 式描述了是否发展油菜籽生产与是否发展养蜂生产的差异对农 副产品总收益的影响 虚拟解释变量D1i和D2i是以加法形式引入的 那么暗含着假定 油菜籽生产和养蜂生产是分别独立地影响农副产品生产总收益 但是 在发展油菜籽生产时 同时也发展养蜂生产 所取得的农副 产品生产总收益可能会高于不发展养蜂生产的情况 即在是否发展油菜 籽生产与养蜂生产的虚拟变量D1i和D2i之间 很可能存在着一定的交互 作用 且这种交互影响对被解释变量 农副产品生产总收益会有影响 为描述虚拟变量交互作用对被解释变量的效应

14、 在 8 9 式中以加法形式引入 两个虚拟解释变量的乘积 即 Yi 0 1D1i 2D2i 3 D1iD2i Xi i 8 10 1 基础类型 不发展油菜籽生产 也不发展养蜂生产时农副产品生产平均总收益 E Yi Xi D1 0 D2 0 0 Xi 8 11 2 比较类型 同时发展油菜籽生产和养蜂生产时 农副产品生产平均总收益 E Yi Xi D1 1 D2 1 0 1 2 3 Xi 8 12 1为是否发展油菜籽生产对农副产品生产总收益的截距差异系数 2为是否发展养蜂生产对农副产品生产总收益的截距差异系数 3为同时发展油菜籽生产和养蜂生产时对农副产品生产总收益的交互效应系数 0 3组成截距水平

15、 其中 关于交互效应是否存在 可借助于交互效应虚 拟解释变量系数的显著性检验来加以判断 如果t 检验表明交互效应D1iD2i在统计意义上 显著时 说明交互效应对Yi存在显著影响 四 虚拟变量的设置原则 每一定性变量所需的虚拟变量个数要比该定性变量的类别数少1 即如果定性变量有m个类别 则只在模型中引入m 1个虚拟变量 例如 已知冷饮的销售量Y除受k个定量变量Xi的影响外 还受一个定性变量季 节即春 夏 秋 冬四季变化的影响 要考察该四季的影响 只需引入三个 虚拟变量即可 D1t 1 春季 0 其它 D2t 1 夏季 0 其它 D3t 1 秋季 0 其它 则冷饮销售量的模型为 8 13 D4t

16、1 冬季 0 其它 在上述模型中 若再引入第四个虚拟变量 则冷饮销售模型变量为 8 14 其矩阵形式为 8 15 如果只取六个观测值 其中春季与夏季取了两次 秋 冬各取到一次 观测值 则其中 模型 8 14 参数无法唯一求出 显显然 中的第1列可表示成后4列的线线性组组合 从而不是满秩的 所谓的 虚拟变量陷阱 第二节 虚拟被解释变量 当虚拟变量作为被解释变量时 其作用是对某一经济现象 或活动进行 是 与 否 的判断或决策 研究是否购买商品住房 是否参加人寿或财产保险 是否 能按期偿还贷款 新产品在市场上是否畅销 对某一改革措施 所持的态度等 例如 例如 假定我们要从一个截面样本度量汽车所有权的决定因素 某些人有汽车 而其他人没有 假定这种所有权函数的决定因素是 收入和职业 则可设定模型为 8 16 其中 Xi表示收入 D1i 1 第i个人是有车者 0 第i个人是无车者 D2i 1 第i个是白领职业 0 其它 显然 这个模型中被解释变量是一个虚拟变量 特征 被研究的对象 即被解释变量 在受到多种因素影响时 其取值 只有两种状态 是 与 否 二元型响应 现象 如何处理二元型响应被解释变量模

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号