第八章(虚拟变量回归)ppt课件

上传人:资****亨 文档编号:134890731 上传时间:2020-06-09 格式:PPT 页数:54 大小:2.68MB
返回 下载 相关 举报
第八章(虚拟变量回归)ppt课件_第1页
第1页 / 共54页
第八章(虚拟变量回归)ppt课件_第2页
第2页 / 共54页
第八章(虚拟变量回归)ppt课件_第3页
第3页 / 共54页
第八章(虚拟变量回归)ppt课件_第4页
第4页 / 共54页
第八章(虚拟变量回归)ppt课件_第5页
第5页 / 共54页
点击查看更多>>
资源描述

《第八章(虚拟变量回归)ppt课件》由会员分享,可在线阅读,更多相关《第八章(虚拟变量回归)ppt课件(54页珍藏版)》请在金锄头文库上搜索。

1、计量经济学Econometrics 2014 2015 1 任课教师 范国斌 第八章虚拟变量回归 2 很多研究认为 影响商品房价格的因素有多个方面 例如 1 成本费用因素 包括土地 建筑物建造成本 其他费用 2 房地产供求因素 包括住房需求量 房地产开发量等 3 经济因素 包括宏观经济状况 物价状况 居民收入状况等 4 人口因素 包括人口密度 家庭结构等 5 社会因素 包括社会治安 城市化水平 消费心理等 6 行政 政策 因素 包括土地与住房制度 房地产价格政策等 7 区域因素 包括所处地段的市政基础设施 交通状况等 8 个别因素 包括朝向 结构 材料 功能设计 施工质量等 9 房地产投机因素

2、 投机者在房地产市场中的投机活动 10 自然因素 包括自然环境 地质 地形 地势及气候等 资料来源 徐静 武乐杰 房地产价格影响因素的解释结构模型分析 金融经济 2009年10期 引子1影响房地产价格的复杂因素 3 在影响房地产价格的众多因素中 有定量的因素 成本因素 房地产供求因素 经济因素 人口因素等 也有定性的因素 社会因素 行政因素 区位因素 个别因素 投机因素 自然因素等 在研究房地产价格影响机理时 需要分析那些不易量化的定性因素对房地产价格是否真的有显著影响 能否把定性的因素也引入计量经济模型中呢 怎样才能在模型中有效地表示这些定性因素的作用呢 4 引子2男女大学生的消费真的有差异

3、吗 当代大学生在消费结构呈现出多元化趋势 大学生除了日常生活费开支以外 还有人际交往 网络通讯 书报 衣着 化妆品 电脑 旅游 食品 学习用品 各种考证等消费 不同性别大学生的消费结构有所不同 专科生 本科生 研究生的消费结构更有差异 不同年级之间 男女同学之间 消费水平 消费结构 消费方式上都存在着差异 注 来源于新华网等 共青团中央 全国学联共同发布的 中国大学生消费与生活形态研究报告 为了研究男女大学生 不同层次大学生 不同年级大学生的消费结构是否有差异 需要将这些定性的因素引入计量模型 怎样才能在模型中有效地表示这类定性因素的作用呢 5 第一节虚拟变量 一 什么是虚拟变量 数量变量与属

4、性变量可用数量表现的连续变量只表明属性的不连续变量属性变量 不能精确计量的说明某种属性或状态的定性变量 如性别 民族 战争 政治事件 本身是定性的二分类变量 非此即彼 本来是连续变量也可转换为定性变量 如上线 不上线 虚拟变量 人工构造的取值为0和1的作为属性变量代表的变量称虚拟变量 一般常用D dummy 表示D 0表示某种属性或状态不出现或不存在D 1表示某种属性或状态出现或存在 6 虚拟变量的作用 作为属性因素的代表 如性别 作为某些非精确计量的数量因素的代表 如受教育程度 高中及以下 专科 本科及以上 作为某些偶然因素或政策因素的代表 如伊拉克战争 911事件 四川汶川大地震 时间序列

5、分析中作为季节 月份 的代表 分段回归 研究斜率 截距的变动 比较两个回归模型的差异 虚拟被解释变量模型 被解释变量本身是定性变量 7 二 虚拟变量模型 虚拟变量模型 包含有虚拟变量的模型称虚拟变量模型三种类型 1 解释变量中只包含虚拟变量作用 假定其他因素都不变 只研究某种定性因素在某定量变量上是否表现出显著差异2 解释变量中既含定量变量 又含虚拟变量作用 研究定量变量和虚拟变量同时对被解释变量的影响3 虚拟被解释变量模型 被解释变量本身取值为0或1作用 对某社会经济现象进行 是 与 否 判断研究 离散选择模型 8 三 虚拟变量的设置规则 1 虚拟变量取值虚拟变量D取值为0 还是取值为1 要

6、根据研究的目的去决定D取值为0的类型 基础类型 作为比较的基准D取值为1的类型 与基础类型相比较的类型例如 D 0如果是女性 基础类型 D 1如果是男性 比较类型 D 0为 911事件 以前 基础类型 D 1为 911事件 以后 比较类型 D 0不是大学毕业生 基础类型 D 1是大学毕业生 比较类型 9 虚拟变量的设置规则 和取值均为0的类型 基础类型 是比较的基准 代表了基准组 西部地区 的截距或分别取值为1的类型 是与基础类型比较的类型 和为差异截距系数 为东部地区 为中部地区 为其他 为其他 又如 研究东 中 西部地区收入X与消费支出Y的关系 虚拟变量的设置原则 虚拟变量的个数须按以下原

7、则确定 每一定性变量所需的虚拟变量个数要比该定性变量的类别数少1 即如果有m个属性类别 只在模型中引入m 1个虚拟变量 例子 已知冷饮的销售量Y除受k种定量变量Xk的影响外 还受春 夏 秋 冬四季变化的影响 要考察该四季的影响 只需引入三个虚拟变量即可 则冷饮销售量的模型为 在上述模型中 若再引入第四个虚拟变量 则冷饮销售模型变为 其矩阵形式为 如果只取六个观测值 其中春季与夏季取了两次 秋 冬各取到一次观测值 则式中的 显然 X D 中的第1列可表示成后4列的线性组合 从而 X D 不满秩 参数无法唯一求出 这就是所谓的 虚拟变量陷阱 应避免 使用虚拟变量需注意的问题 虚拟变量陷阱 若定性变

8、量有m个类别 则引入m个虚拟变量将会产生完全多重共线性问题 避免方法 只引入 m 1 个虚拟变量引入m个虚拟变量但去掉截距项哪种方法更好 包含截距项更方便 可以很容易地检验某个组与基准组之间是否存在显著差异以及差异程度 14 1 在有截距的模型中如果模型中每个定性因素有m个相互排斥的类型 模型中只能引入m 1个虚拟变量 否则会出现完全多重共线性例如 一个定性因素有三种类型 若设三个虚拟变量若 若 等等 显然此时 而截距对应的变量为1 再次生成了截距项 则导致了完全的多重共线性 2 避免落入 虚拟变量陷阱 15 模型为此时虽然有 若 若 且 但因为没有截距项 不会出现完全的多重共线性 注意 此时

9、等参数不再是差异截距系数 而分别是相应类型的截距 2 若模型中无截距项 16 第二节虚拟解释变量回归 定性变量作为解释变量 可以影响模型的截距 也可以影响模型的斜率 还可以同时影响截距和斜率只使截距变动只使斜率变动使截距与斜率都变动一 用虚拟变量表示不同截矩的回归 加法类型虚拟变量以加法方式引入模型的作用 改变模型中截距 可分为各种情况去设置虚拟变量 虚拟变量的引入 企业男职工的平均薪金为 企业职工薪金模型中性别虚拟变量的引入采取了加法方式 1 加法方式 企业女职工的平均薪金为 在该模型中 如果仍假定E i 0 则 几何意义 假定 2 0 则两个函数有相同的斜率 但有不同的截距 意即 男女职工

10、平均薪金对教龄的变化率是一样的 但两者的平均薪金水平相差 2 可以通过传统的回归检验 对 2的统计显著性进行检验 以判断企业男女职工的平均薪金水平是否有显著差异 又例 在横截面数据基础上 考虑个人保健支出对个人收入和教育水平的回归 教育水平考虑三个层次 高中以下 高中 大学及其以上 模型可设定如下 这时需要引入两个虚拟变量 在E i 0的初始假定下 高中以下 高中 大学及其以上教育水平下个人保健支出的函数 高中以下 高中 大学及其以上 假定 3 2 其几何意义 还可将多个虚拟变量引入模型中以考察多种 定性 因素的影响 如在上述职工薪金的例中 再引入代表学历的虚拟变量D2 本科及以上学历本科以下

11、学历 职工薪金的回归模型可设计为 女职工本科以下学历的平均薪金 女职工本科以上学历的平均薪金 于是 不同性别 不同学历职工的平均薪金分别为 男职工本科以下学历的平均薪金 男职工本科以上学历的平均薪金 23 1 解释变量只有一个分为两种类型的定性变量无定量变量的回归这种模型又称方差分析模型其中 为公立学校教师工资 0为农村学校 D 1为城镇学校分析条件期望 基础类型 比较类型 为差异截距系数 通过对系数的t检验 可检验在其他因素不变的条件下 城乡教师的工资是否有显著差别 23 24 2 解释变量包含一个定量变量和一个分为两种类型的定性变量的回归例如 为服装消费 为收入 0为男性D 1为女性分析条

12、件期望 基础类型 比较类型 为差异截距系数对系数的t检验 可检验定性因素对截距是否有显著影响注意 应服从基本假定 这里一个定性变量具有两种类型 只使用了一个虚拟变量 为什么 25 3 解释变量包含一个定量变量和一个两种以上类型的定性变量的回归 类型 高中以下 高中毕业 大学毕业及以上 三种类型模型例如 年工资 工龄 1只是高中毕业 1大学毕业及以上 0其他 0其他基础类型 高中以下 比较类型 高中 大学及以上 差异截距系数为和问题 如果还要区分 专科 本科 硕士 博士 应怎么办 26 注意 应服从基本假定 一个定性变量有三种类型 使用了两个虚拟变量 和代表的是同一个定性变量的两种不同类型 两个

13、差异截距系数和表示的都是与基础类型的差异 一个定性变量有多种类型时 虚拟变量可同时取值为0 但不能同时取值为1 因同一定性变量的各类型间 非此即彼 27 4 解释变量包含一个定量变量和两个定性变量 模型这里的和代表的是两个不同的定性变量 各分为两种类型例如 为文化支出 为收入用t检验分别检验和的统计显著性 验证两个定性变量对截距是否有显著影响 高中及以上文化程度 农村居民 城镇居民 高中以下文化程度 对比类型 基础类型 28 注意 应服从基本假定 两个定性变量分别有两种类型 用了两个虚拟变量 为什么 两个定性变量和一个定性变量三种类型都用了两个虚拟变量 但其性质是不同的 K个定性变量可选用K个

14、虚拟变量去表示 这不会出现 虚拟变量陷阱 代表不同定性变量的虚拟变量 可以同时为0 也可同时为1 因为不同定性变量间没有 非此即彼 的关系 29 二 用虚拟变量表示不同斜率的回归 模型中斜率系数的差异 可用以乘法形式引入的虚拟变量去表示 乘法类型 乘法方式 加法方式引入虚拟变量 考察 截距的不同 许多情况下 往往是斜率就有变化 或斜率 截距同时发生变化 斜率的变化可通过以乘法的方式引入虚拟变量来测度 例 根据消费理论 消费水平C主要取决于收入水平Y 但在一个较长的时期 人们的消费倾向会发生变化 尤其是在自然灾害 战争等反常年份 消费倾向往往出现变化 这种消费倾向的变化可通过在收入的系数中引入虚

15、拟变量来考察 这里 虚拟变量D以与X相乘的方式引入了模型中 从而可用来考察消费倾向的变化 如设 消费模型可建立如下 假定E i 0 上述模型所表示的函数可化为 正常年份 反常年份 当截距与斜率发生变化时 则需要同时引入加法与乘法形式的虚拟变量 例 考察1990年前后的中国居民的总储蓄 收入关系是否已发生变化 下表给出了中国1979 2001年以城乡储蓄存款余额代表的居民储蓄以及以GNP代表的居民收入的数据 以Y为储蓄 X为收入 可令 1990年前 Yi 1 2Xi 1ii 1 2 n11990年后 Yi 1 2Xi 2ii 1 2 n2 则有可能出现下述四种情况中的一种 1 1 1 且 2 2

16、 称为重合回归 2 1 1 但 2 2 差异仅在其截距 称为平行回归 3 1 1 但 2 2 差异仅在其斜率 称为同截距回归 4 1 1 且 2 2 两个回归完全不同 称为非相似回归 虚拟变量模型的应用 虚拟变量是一个能处理一系列有趣问题的灵活工具 虚拟变量模型的应用包括 结构变化的检验虚拟变量的交互效应分段线性回归时间序列数据中的季节调整 36 1 回归模型比较 结构变化的检验 回顾 邹氏参数稳定性检验可以检验模型结构是否发生了变化 结构无变化作受约束模型 结构变化作无约束模型邹氏检验只能检验模型结构是否发生变化 不能说明具体变化了多少 也不能说明究竟是截距变化还是斜率变化 例如 怎样说明以下变化呢 重合回归 平行回归 同截距 共点 回归 非相似 不同 回归 36 37 结构变化的检验 模型基础类型 对比类型 可看出 以加法引入虚拟变量D的系数是截距的差异系数 以乘法引入虚拟变量D的系数是斜率的差异系数用t检验分别检验和的显著性 可检验此定性变量对截距和斜率是否有显著影响 即检验两个回归的结构是否有差异优点 用一个回归替代了多个回归 简化了分析过程 可方便地检验各种假设 合并回归增加

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号