文档详情

虚拟变量哑变量回归ppt课件

汽***
实名认证
店铺
PPT
962.50KB
约11页
文档ID:593294104
虚拟变量哑变量回归ppt课件_第1页
1/11

——虚虚拟变拟变量的运用量的运用多元线性回归 Contents虚拟变量的建立虚拟变量的建立1虚拟变量回归系数的意义虚拟变量回归系数的意义2虚拟变量回归分析的检验虚拟变量回归分析的检验3SPSS实例操作实例操作4 一、虚拟变量的建立一、虚拟变量的建立虚拟变量〔虚拟变量〔Dummy Variable〕:取值为〕:取值为0和和1的变量,当案的变量,当案例属于一个虚拟例属于一个虚拟 变量所代表的类别时,这个虚拟变量就赋值为变量所代表的类别时,这个虚拟变量就赋值为1,否,否那么变赋值为那么变赋值为0Di = 1 ,是女性 = 0 ,不是女性例1:例2:大学生年级变量具有四个类别,如何构造?其中, D1=1,是大一,否那么为0; D2=1,是大二,否那么为0; D3=1,是大三,否那么为0; D4=1,是大三,否那么为0虚拟变量圈套〞 虚拟变量的建立虚拟变量的建立D1+D2+D3+D4=1,阐明D1,D2,D3,D4存性相关,呵斥多重共线性处理方法:原那么:当一个分类量具有k个类别时,那么仅引入k-1个虚拟变量当一切k-1个自变量都取0的时候,那这个案例就属于第k类,我们称这类为参照类,参照类不仅处理了共线性的问题,而且在分析回归结果时也有非常重要的意义 二、虚拟变量回归系数的意义二、虚拟变量回归系数的意义因变量为大学生的月支出,自变量有家庭月收入,年级,性别建立回归方程:〔〔0〕〕其中, DG2=1,是大二,否那么为0; DG3=1,是大三,否那么为0; DG4=1,是大三,否那么为0。

DS=1,是女生,否那么为0 虚拟变量回归系数的意义虚拟变量回归系数的意义〔〔1〕〕参照类:大一男生〔一切虚拟变量均取0〕变式1:大二男生〔DG2=1,虚拟变量均取0〕〔〔2〕〕变式2:大一女生〔DS=1,虚拟变量均取0〕〔〔3〕〕参照类中,b0为直线的截距,b1为直线斜率,即 INCOME 的回归系数由式〔1〕到式〔2〕,截距项添加了b2,因此b2就是大二男生比大一男生月支出高的部分;由式〔1〕到式〔3〕,截距项添加了b4,因此b4就是大一女生比大一男生月支出高的部分差别截距:一切表示各类别虚拟变量的回归系数〔bj〕表示的是该类与参照类的均值之差〔对于序次变量还可计算相邻分类的边沿效应,恣意两类的边沿效应〕 虚拟变量回归系数的意义虚拟变量回归系数的意义1. 只思索年级对月支出的影响 等价于 单要素方差分析〔1-way ANOVA〕2. 同时思索年级、性别对月支出的影响 等价于 双要素方差分析〔2-way ANOVA〕只思索主效应的双要素方差分析3. 同时思索年级、性别、家庭月收入的影响 等价于 协方差分析〔ANCOVA〕含交互作用的饱和双要素方差分析 三、虚拟变量回归系数的检验三、虚拟变量回归系数的检验p对整个模型的检验〔F检验〕p H0:B1=B2=…=Bk=0p H1:B1,B2,…,Bk中至少有一个不为0p对各回归系数的检验〔t检验〕p H0:Bj=0p H1:Bj≠0p对于虚拟变量,由于取值只能为0和1,所以检验的是取值为1的类别与参照类〔一切取值为0〕的平均值能否有显著性差别p虚拟变量回归只能做其他类和参照类的比较p直接对恣意两个回归系数之差进展检验的方法:p1、建立无差别假设:H0:Bi=Bj; H1:Bi≠Bjp2、构造t统计量:p3、检验其显著性其中 补充问题补充问题p参照类的选择p 根据研讨者的选择偏好,无本质性影响p其他编码方法p 效应编码〔effect coding〕、正交编码〔orthogonal coding〕、非正交编码〔nonorthogonal coding〕p效应编码p 虚拟编码:定义参照类,回归系数表示各类与参照类均值的差p 效应编码:其回归系数反映的是各类的平均值与样本平均值的差效效应编码原那么:原那么:对于前于前k-1个效个效应变量,当案例属于量,当案例属于该效效应变量量时,效,效应变量取量取值为1,不属于取,不属于取值为0;;当案例属于最后一当案例属于最后一类不不设虚虚拟变量的一量的一类时,,一切效一切效应变量取量取-1 四、四、SPSS实例操作实例操作例:分析妇女的年龄〔AGE〕、文化程度〔EDU〕及居住地〔AREA〕情况对妇女曾生子女数〔CEB〕的影响。

其中,文化程度分为文盲或半文盲〔1〕、小学〔2〕、初中〔3〕、 高中〔4〕和大学〔5〕共五类 居住地分为城市〔1〕和乡村〔2〕共两类。

下载提示
相似文档
正为您匹配相似的精品文档