在处理数据时我们经常会遇到应变量是二分类

上传人:hs****ma 文档编号:511315184 上传时间:2022-12-25 格式:DOC 页数:4 大小:17.50KB
返回 下载 相关 举报
在处理数据时我们经常会遇到应变量是二分类_第1页
第1页 / 共4页
在处理数据时我们经常会遇到应变量是二分类_第2页
第2页 / 共4页
在处理数据时我们经常会遇到应变量是二分类_第3页
第3页 / 共4页
在处理数据时我们经常会遇到应变量是二分类_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《在处理数据时我们经常会遇到应变量是二分类》由会员分享,可在线阅读,更多相关《在处理数据时我们经常会遇到应变量是二分类(4页珍藏版)》请在金锄头文库上搜索。

1、在处理数据时,我们经常会遇到应变量是二分类【关键词】在处理数据时在处理数据时,我们经常会遇到应变量是二分类、多分类的情况,例如:发病与不发病,成功与失败,治疗结局为治愈、好转、无效等,假设事件发生的概率为P,n次观测是独立的条件下,一般采用Lgisti回归分析数据,该模型中自变量可以是连续的,也可以是分类变量,应用非常广泛。SAS软件提供了Lgisti、gend,nlixed,atd等过程来分析资料,本研究讨论如何使用不同的过程来分析二分类与多分类Lgisti回归模型。1应变量为二分类的Lgisti回归例1:欲研究性别和不同疗法对某病治愈与否的影响,数据见表1。表1性别与疗法对某病的影响略程序

2、:dataaa;inputsextreatyunt;ards;a178a028b1101b011f06;方法1:PRGENDdata=aadesending;lasssextreat;frequnt;delrespnse=sextreat/dist=biniallink=lgit;run;/*dist=binial和link=lgit拟合二分类lgisti回归模型*/方法2:PRLGISTIdata=aadesending;lasssextreat/para=refref=last;frequnt;delrespnse=sextreat;run;方法3:pratdrder=data;Eight

3、unt;dely=sextreat;run;为理解释的直观性,我们通常把所感兴趣的应变量的值排到最后按升序,拟合事件event发生的概率,例1中选用选择项desending,拟合应变量y=1的概率,即拟合rderedvalue为1所对应y的取值。SAS软件中使用LASS语句的过程多数把最大的编码值按升序排列作为参照类,其他类别的参数估计值都是与它相比而得到的。例如:男性ale与女性feale相比,我们要设置男性gender=0,女性gender=1。选择项ref=p-tin可以指明参照程度,指定某一个程度作为参照,也可以使用关键字first或last。例如LASSgenderREF=first

4、/PARA=ref,得到ales/Feales,如没有选择项REF=first,比拟的是Feales/ales。分类自变量如何编码影响到输出结果是否一样,缺省情况下,gend过程对分类自变量编码值为0和1,而Lgisti回归默认的编码为-1和1,atd过程的的参数化形式称为与均数离差的参数化,如一个因素有k个程度,那么以k-1个参数表示,第k个程度的参数等于前k-1个程度参数之和的负值。lass语句的选择项para=keyrd可以用来指明分类变量的参数化形式paraeterizatin,选择项有effet,p-ly,ref等。例1中gend和lgisti过程的参数估计结果一样,而与atd过程的

5、结果有差异,见表3、4,原因在于它们对分类变量的设计矩阵不同,见表2。表2不同过程的设计矩阵gend和lgisti过程的设计矩阵略表3gend和lgisti过程参数估计的结果略表4atd过程参数估计的结果略atd过程中把参照类取值为-1,而gend和lgisti过程取值为0,它们的系数有一定的关系,例如sex的系数0.9616=0.4808-0.4808,b疗法的系数1.5608=0.8456-0.1304+0.8456,考虑到系数的可解释性,用at-d过程拟合模型时可以自己建立参照类赋值为0的哑变量,并且使用diret语句说明它们是定量变量,例1可以写成:dataaa;inputsextre

6、atatreatbyunt;ards;1001681000461101781100281011101101011000134;pratdrder=data;eightunt;diretsextreatatreatb;dely=sextreatatreatb;run;2有序多分类Lgisti回归设PYj=1x+jx,j=1,JlgitPYj/x=lgPYj/x1-PYj/x=lg1x+jxj+1x+Jx,j=1,J-1,累积lgit模型:lgitPYj/x=j+x,j=1,J-1。每个累积lgit模型有自己的截距项j,随着j增大而增大,有一样的即与分割点无关,所以也称比例优比模型prprtina

7、lddsdel。例2:欲研究性别、两种治疗方法对某病疗效的影响,疗效的评价分为3个有序等级:显效、有效和无效,数据见表5。表5性别和两种治疗方法对某病疗效的影响略SAS程序:dataaa;dsex=0t1;dtreat=0t1;dute=1t3;inputx;utput;end;end;end;ards;101052767191656方法1:prgend;delute=sextreat/dist=ultiniallink=lgitlritype3;/*dist=ultinial和link=lgit拟合有序多分类lgisti回归模型累积lgisti模型*/freqx;run;在拟合模型时,检查应

8、变量的排列顺序,这一点可以看表6。缺省情况下,gend过程拟合从低到高反响类别的有序多分类Lgisti回归模型,本例拟合lgPute=1Pute=2+Pute=3与lgPute=1+Pute=2Pute=3,可以通过选择项RRDER=或desending来改变应变量的缺省顺序,本例参数估计见表7。方法2:prlgisti;freqx;delute=sextreat;run;表6反响变量的响应剖面RespnsePrfile略表7例2参数估计的结果略表8比例优比假设检验略假如不满足比例优比的假设条件,可以拟合无序多分类lgis-ti回归,或拟合偏比例优比模型partialprprtinalddsd

9、el,或者当应变量的某一个程度的样本含量小时,拟合模型时去掉这些程度。3无序多分类Lgisti回归Y是分类反响变量,有J个类别,x为解释变量,设j=PY=j/x,有jj=1,以最后的类别作为参照类,可以建立J-1个lgit模型,J-1个公式中的j,j是不同的。lgjxJxj+jx,j=1,J-1,例3:欲研究不同社区、性别对成人获取安康知识途径的差异,数据见表9。表9不同社区、性别的成人获取安康知识途径的研究略SAS程序:dataaa;dunity=1t3;dsex=0t1;dute=1t3;inputx;utput;end;end;end;ards;203526102757421726161

10、226151516111220;方法1:prlgisti;freqx;lassunitysex;deluteref=3=unitysex/link=glgitaggregatesale=nne;run;/*link=glgit拟合无序多分类lgisti回归模型;ref=指明参照的类别*/方法2:pratd;Eightx;ppulatinunitysex;/*规定母体,由指定变量的穿插分类形成*/delute=sexunity;run;缺省情况下atd过程以应变量的最大值作为参照类按照字母顺序或数字顺序,假如想以最小值作为参照类,可以对应变量做降序排列,即prsrt;bydesendingute

11、;pratdrder=aa;但需要注意:当数据量较大时耗时长,应变量赋值时最好与SAS默认的情况一致。参数估计结果见表10。表10例3参数估计结果略4讨论我们经常会遇到应变量为分类变量的情况,SAS/STAT中有很多过程可以做lgisti回归,每个过程有各自的特点。atd过程提供各种属性数据分析,例如对数线性模型、L-gisti回归,重复观测资料的分析等,缺省时认为自变量都是分类变量;gend过程是generalizedlineardels的缩写,可以拟合广义线性模型,应变量可以是正态分布、二项分数、gaa分布、负二项、Pissn分布等,例如pissn回归、prbit回归等,还可以对边际模型拟

12、合广义估计方程;Lgis-ti过程可以分析应变量是二分类、多分类有序或无序的Lgisti模型,默认的连接函数为lgit,该过程可以对自变量进展挑选,例如向前法、向后法、逐步法等,从而从众多自变量中挑选出重要的预后因子,还可以计算回归诊断量,这是其广泛应用的原因之一。不同过程的最大似然算法不同,lgisti过程使用Fisherssring方法,而gend、atd过程使用Netn-Raphsn方法。当自变量是分类变量时,不同过程的参数估计值可能不同,可能是由于设计矩阵中的编码方式不同。lgisti回归模型处理数据有时会出现一个或几个自变量的的可信区间值特别大的情况,这时可以使用freq过程分类变量或eans连续变量查看自变量或应变量的分布情况,通过增加样本含量,或者不考虑某些自变量或将某些自变量的程度合并来解决这一问题。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号