虚拟变量哑变量回归

上传人:桔**** 文档编号:584307661 上传时间:2024-08-30 格式:PPT 页数:11 大小:902.50KB
返回 下载 相关 举报
虚拟变量哑变量回归_第1页
第1页 / 共11页
虚拟变量哑变量回归_第2页
第2页 / 共11页
虚拟变量哑变量回归_第3页
第3页 / 共11页
虚拟变量哑变量回归_第4页
第4页 / 共11页
虚拟变量哑变量回归_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《虚拟变量哑变量回归》由会员分享,可在线阅读,更多相关《虚拟变量哑变量回归(11页珍藏版)》请在金锄头文库上搜索。

1、虚拟变量的应用多元线性回归Contents虚拟变量的建立虚拟变量的建立1虚拟变量回归系数的意义虚拟变量回归系数的意义2虚拟变量回归分析的检验虚拟变量回归分析的检验3SPSS实例操作实例操作4一、虚拟变量的建立一、虚拟变量的建立虚拟变量虚拟变量(Dummy Variable):取值为0和1的变量,当案例属于一个虚拟 变量所代表的类别时,这个虚拟变量就赋值为1,否则变赋值为0Di = 1 ,是女性 = 0 ,不是女性例1:例2:大学生年级变量具有四个类别,如何构造?其中, D1=1,是大一,否则为0; D2=1,是大二,否则为0; D3=1,是大三,否则为0; D4=1,是大三,否则为0。“虚拟变

2、量陷阱”虚拟变量的建立虚拟变量的建立D1+D2+D3+D4=1,说明D1,D2,D3,D4存在线性相关,造成多重共线性解决办法:原则:当一个分类量具有k个类别时,则仅引入k-1个虚拟变量。当所有k-1个自变量都取0的时候,那这个案例就属于第k类,我们称这类为参照类,参照类不仅解决了共线性的问题,而且在分析回归结果时也有非常重要的意义二、虚拟变量回归系数的意义二、虚拟变量回归系数的意义因变量为大学生的月支出,自变量有家庭月收入,年级,性别建立回归方程:(0)其中, DG2=1,是大二,否则为0; DG3=1,是大三,否则为0; DG4=1,是大三,否则为0。 DS=1,是女生,否则为0虚拟变量回

3、归系数的意义虚拟变量回归系数的意义(1)参照类:大一男生(所有虚拟变量均取0)变式1:大二男生(DG2=1,虚拟变量均取0)(2)变式2:大一女生(DS=1,虚拟变量均取0)(3)参照类中,b0为直线的截距,b1为直线斜率,即 INCOME 的回归系数由式(1)到式(2),截距项增加了b2,因此b2就是大二男生比大一男生月支出高的部分;由式(1)到式(3),截距项增加了b4,因此b4就是大一女生比大一男生月支出高的部分。差别截距:所有表示各类别虚拟变量的回归系数(bj)表示的是该类与参照类的均值之差。(对于序次变量还可计算相邻分类的边际效应,任意两类的边际效应)虚拟变量回归系数的意义虚拟变量回

4、归系数的意义1. 只考虑年级对月支出的影响 等价于 单因素方差分析(1-way ANOVA)2. 同时考虑年级、性别对月支出的影响 等价于 双因素方差分析(2-way ANOVA)只考虑主效应的双因素方差分析3. 同时考虑年级、性别、家庭月收入的影响 等价于 协方差分析(ANCOVA)含交互作用的饱和双因素方差分析三、虚拟变量回归系数的检验三、虚拟变量回归系数的检验p对整个模型的检验(F检验) H0:B1=B2=Bk=0 H1:B1,B2,Bk中至少有一个不为0p对各回归系数的检验(t检验) H0:Bj=0 H1:Bj0对于虚拟变量,由于取值只能为对于虚拟变量,由于取值只能为0 0和和1 1,

5、所以检验的是取值为,所以检验的是取值为1 1的类别与参的类别与参照类(所有取值为照类(所有取值为0 0)的平均值是否有显著性差异)的平均值是否有显著性差异p虚拟变量回归只能做其他类和参照类的比较直接对任意两个回归系数之差进行检验的方法:1、建立无差异假设:H0:Bi=Bj; H1:BiBj2、构造t统计量:3、检验其显著性其中补充问题补充问题p参照类的选择 根据研究者的选择偏好,无实质性影响p其他编码方法 效应编码(效应编码(effect coding)、正交编码()、正交编码(orthogonal coding)、非正交编码)、非正交编码(nonorthogonal coding)效应编码

6、虚拟编码:定义参照类,回归系数表示各类与参照类均值的差 效应编码:其回归系数反映的是各类的平均值与样本平均值的差效应编码原则:效应编码原则:对于前对于前k-1个效应变量,当案例属于该效应变个效应变量,当案例属于该效应变量时,效应变量取值为量时,效应变量取值为1,不属于取值为,不属于取值为0;当案例属于最后一类不设虚拟变量的一类时,当案例属于最后一类不设虚拟变量的一类时,所有效应变量取所有效应变量取-1四、四、SPSS实例操作实例操作例:分析妇女的年龄(AGE)、文化程度(EDU)及居住地(AREA)状况对妇女曾生子女数(CEB)的影响。 其中,文化程度分为文盲或半文盲(1)、小学(2)、初中(3)、 高中(4)和大学(5)共五类 居住地分为城市(1)和农村(2)共两类。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 幼儿/小学教育 > 小学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号