计量经济学(第四版)3.6 虚拟变量模型

上传人:au****y 文档编号:49131930 上传时间:2018-07-24 格式:PPT 页数:21 大小:251.50KB
返回 下载 相关 举报
计量经济学(第四版)3.6 虚拟变量模型_第1页
第1页 / 共21页
计量经济学(第四版)3.6 虚拟变量模型_第2页
第2页 / 共21页
计量经济学(第四版)3.6 虚拟变量模型_第3页
第3页 / 共21页
计量经济学(第四版)3.6 虚拟变量模型_第4页
第4页 / 共21页
计量经济学(第四版)3.6 虚拟变量模型_第5页
第5页 / 共21页
点击查看更多>>
资源描述

《计量经济学(第四版)3.6 虚拟变量模型》由会员分享,可在线阅读,更多相关《计量经济学(第四版)3.6 虚拟变量模型(21页珍藏版)》请在金锄头文库上搜索。

1、3.6 含有虚拟变量的多元线性回归 模型 一、含有虚拟变量的模型 一、虚拟变量的引入 二、虚拟变量的设置原则 一、含有虚拟变量的模型1、虚拟变量(dummy variables) 许多经济变量是可以定量度量。 一些影响经济变量的因素是无法定量度量。 为了在模型中能够反映这些因素的影响,并提高 模型的精度,需要将它们“量化”。 这种“量化”通常是通过引入“虚拟变量”来完成的 。根据这些因素的属性类型,构造只取“0”或“1” 的人工变量,通常称为虚拟变量,记为D。 虚拟变量只作为解释变量。 一般地,在虚拟变量的设置中: 基础类型、肯定类型取值为1; 比较类型,否定类型取值为0。 例如,反映文程度的

2、虚拟变量可取为: D=1,本科学历 D=0,非本科学历 虚拟变量能否取1、0以外的数值?2、虚拟变量模型 同时含有一般解释变量与虚拟变量的模型称为 虚拟变量模型或者方差分析(analysis-of variance: ANOVA)模型。 例如,一个以性别为虚拟变量考察企业职工薪 金的模型:其中:Yi为企业职工的薪金;Xi为工龄; Di=1 ,若是男性,Di=0,若是女性。二、虚拟变量的引入1、加法方式 虚拟变量作为解释变量引入模型有两种基本方 式:加法方式和乘法方式。 上述企业职工薪金模型中性别虚拟变量的引入 采取了加法方式。 在该模型中,如果仍假定E(i)=0,则企业男、女职 工的平均薪金为

3、: 假定20,则两个函数有相同的斜率,但有不同的截距 。意即,男女职工平均薪金对工龄的变化率是一样的, 但两者的平均薪金水平相差2。 可以通过对2的统计显著性进行检验,以判断企业男女 职工的平均薪金水平是否有显著差异。02 将上例中的性别换成教育水平,教育水平考虑 三个层次:高中以下、高中、大学及其以上。高中以下高中大学及以上 在上例中同时引入性别和教育水平:女职工本科以下学历的平均薪金:女职工本科以上学历的平均薪金:男职工本科以下学历的平均薪金:男职工本科以上学历的平均薪金:2、乘法方式 加法方式引入虚拟变量,考察:截距的不同。 许多情况下,斜率发生变化,或斜率、截距同时 发生变化。 斜率的

4、变化可通过以乘法的方式引入虚拟变量来 测度。 例如,根据消费理论,收入决定消费。但是, 农村居民和城镇居民的边际消费倾向往往是不 同的。这种消费倾向的不同可通过在消费函数 中引入虚拟变量来考察。农村居民:城镇居民 :3、同时引入加法与乘法形式的虚拟变量 当截距与斜率发生变化时,则需要同时引入加 法与乘法形式的虚拟变量。 对于一元模型,有两组样本,则有可能出现下 述四种情况中的一种: 1=1 ,且2=2 ,即两个回归相同,称为重合回 归(Coincident Regressions); 11 ,但2=2 ,即两个回归的差异仅在其截距, 称为平行回归(Parallel Regressions);

5、1=1 ,但22 ,即两个回归的差异仅在其斜率 ,称为汇合回归(Concurrent Regressions); 11,且22 ,即两个回归完全不同,称为相异 回归(Dissimilar Regressions)。4、例题 判断中国农村居民与城镇居民的消费行为是否 有显著差异。 被解释变量:居民家庭人均生活消费支出Y 解释变量:居民家庭人均工资收入X1、其他收入X2 样本:2013年31个地区农村居民与城镇居民人均数 据 虚拟变量Di:农村居民取值1,城镇居民取值0 由变量显著性检验得到:在10%的显著性水平下,Di和 DiXi1是显著的,而DiXi2不显著。因此: 2013年农村居民的平均消

6、费支出要比城镇居民少 1573.9元; 在其他条件不变的情况下,农村居民与城镇居民的工 资收入都增加100元时,农村居民要比城镇居民多支出 19元用于生活消费; 农村居民与城镇居民在其他收入方面有相同的增加量 时,两者增加的消费支出没有显著差异。总体回归模型样本回归函数三、虚拟变量的设置原则 每一定性变量(qualitative variable)所需的虚 拟变量个数要比该定性变量的状态类别数 (categories)少1。即如果有m种状态,只在模 型中引入m-1个虚拟变量。 例如,季节定性变量有春、夏、秋、冬4种状 态,只需要设置3个虚变量: 如果设置第4个虚变量,则出现“虚拟变量陷井”(

7、Dummy Variable Trap)。为什么? 例如:包含季节变量的正确模型:解释变 量完全 共线性错误模型 如果在服装需求函数模型中必须包含3个定性 变量:季节(4种状态)、性别(2种状态)、 职业(5种状态),应该设置多少虚变量? 模型含常数项 模型不含常数项讨论:定序定性变量可否按照状态赋值? 例如:表示居民对某种服务的满意程度,分5种状态: 非常不满意、一般不满意、无所谓、一般满意、非常 满意。在模型中按照状态分别赋值0、1、2、3、4或 者2、1、0、1、2。 被经常采用,尤其在管理学、社会学研究领域。 正确的方法: 设置多个虚拟变量,理论上正确,带来自由度损失。 以定性变量为研究对象,构造多元排序离散选择模型,然后 以模型结果对定性变量的各种状态赋值。但需要更多的信息 支持。 赋值的方法等于是对虚变量方法中的各个虚变量的参 数施加了约束,而这种约束经常被检验为错误的。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号