实验3-logistic回归

上传人:子 文档编号:51717595 上传时间:2018-08-16 格式:PPT 页数:21 大小:211.50KB
返回 下载 相关 举报
实验3-logistic回归_第1页
第1页 / 共21页
实验3-logistic回归_第2页
第2页 / 共21页
实验3-logistic回归_第3页
第3页 / 共21页
实验3-logistic回归_第4页
第4页 / 共21页
实验3-logistic回归_第5页
第5页 / 共21页
点击查看更多>>
资源描述

《实验3-logistic回归》由会员分享,可在线阅读,更多相关《实验3-logistic回归(21页珍藏版)》请在金锄头文库上搜索。

1、非条件Logistic 回归分析w因变量(结局):分类变量n两分类反应变量(proc logistic) n多分类有序反应变量(proc logistic) n多分类无序反应变量( proc catmod)w自变量(各种影响因素) :可以是分类变量,也 可以是连续型变量。数据特征非条件logistic回归模型wLogistic回归模型:w参数的估计:极大似然(MLE) w假设检验:似然比检验: G=(-2lnL)-(-2lnL)Wald检验:记分检验参数估计与假设检验非条件logistic回归模型w常数项 表示当所有自变量均为0时优势的 对数。队列研究中, 表示基线状态 下,个体的发病率;病例

2、对照研究中, 表示基线状 态下,病例在研究对象中所占比例;横断面研究中, 表示基线状 态下,个体的患病率。w回归系数 表示当其它自变量固定不变 时,X每改变一个单位,优势对数的改变 量(优势比的对数)。非条件logistic回归模型wX为两分类变量(取值为1和0)时,暴露者发 病的危险性是非暴露者的exp()倍; wX为等级变量(0,1,2,3)时,X每增加一 个等级,发病的危险性是前一个等级的exp( )倍; wX为连续变量时,X每增加1,发病的危险性是 增加前的exp()倍(注意实际意义); wX为无序多分类变量时,采用哑变量形式。回归系数的解释w多分类变量:哑变量(dummy varia

3、ble)nx1时:D10, D20, D30 表示A型血nx2时:D11, D20, D30 表示B型血nx3时:D10, D21, D30 表示AB型血nx4时:D10, D20, D31 表示O型血nexp(1) 表示B与A比之OR;nexp( 2) 表示AB与A比之OR;nexp( 3) 表示O与A比之OR。SAS程序: D1=(age=2); D2=(age=3); D3=(age=4);基本语句wProc logistic des; 指定响应变量水平按降序的顺序 。Model 反应变量=自变量/ ; /*建立模型*/freq 变量名; /*指定频数变量*/run; MODEL语句的选

4、项 w关于变量选择:nselection=stepwise| forward| backward| score 其中 score要求选择最优子集nbest=n 当指定score进行变量选择时,要求输出得 分卡方统计量最高的前n个模型。nsle或sls 指定进入或剔除出模型的检验水准,缺 省为0.05w参数估计nalpha= 设置可信区间的置信度nCLPARM=PL|WALD|BOTH规定对参数 计算可信区间,选PL表示根据似然函数计算 ,选WALD根据WALD统计量计算,选 BOTH则计算上述两种方法的可信区间。nCLOODS=PL|WALD|BOTH规定对优比 比率计算可信区间。MODEL语

5、句的选项 例1:雌激素 病例对对照 使用 55 19 未使用 128164子宫内膜癌的病例对照研究P1:病例组中暴露比例 P0:对照组中暴露比例P1/1-P1:病例组中暴露优势 P0/1-P0:对照组中暴露优势Data a; Input y drink age f; Cards; 11111010 11241025 1132510321 1144210434 1151910536 11651068 0119001106 01226002164 01329003138 01427004138 0151800588 016000631 ; proc logistic descending; fre

6、q f; model y= drink ; run;logit(P)=-1.855+1.728drink 结果解释:饮酒具有统计学意义(x2=97.2759,P0.05),饮酒者 发生食管癌的危险是不饮酒者的5.632(95%CI=3.9957.940)倍。模型1proc logistic descending;freq f;model y= drink age ;run;结果解释?模型2logit(P)=-4.0977+1.7780drink+0.6158age,年龄有无统计学意义? 饮酒因素的解释:控制其他变量的情况下,饮酒具有统计学意义 ( x2=90.3148,P0.05 ),饮酒者发

7、生食管癌的危险是不饮酒 者的5.918(95%CI=4.1018.539)倍。Data a; Input y drink age f; age1=(age=2); age2=(age=3); age3=(age=4); age4=(age=5); age5=(age=6); Cards; 11111010 11241025 1132510321 1144210434 1151910536 11651068 0119001106 01226002164 01329003138 01427004138 0151800588 016000631 ; proc logistic descending; freq f; model y= drink age1-age5; run;结果解释?模型3哑变量的定义方法2: proc logistic descending; freq f; class age; model y= age; /*年龄以哑变量形式进入模型,以高水平 作为参照组*/ run;论文:电子版 分析参保职工就诊社区卫生服务 的影响因素。请写出主要的分析 结果。 进行单因素、多因素Logistic回归.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号