logistic 回归 线性模型的几种表现形式分析

上传人:小** 文档编号:88272518 上传时间:2019-04-22 格式:PPT 页数:40 大小:167.52KB
返回 下载 相关 举报
logistic 回归 线性模型的几种表现形式分析_第1页
第1页 / 共40页
logistic 回归 线性模型的几种表现形式分析_第2页
第2页 / 共40页
logistic 回归 线性模型的几种表现形式分析_第3页
第3页 / 共40页
logistic 回归 线性模型的几种表现形式分析_第4页
第4页 / 共40页
logistic 回归 线性模型的几种表现形式分析_第5页
第5页 / 共40页
点击查看更多>>
资源描述

《logistic 回归 线性模型的几种表现形式分析》由会员分享,可在线阅读,更多相关《logistic 回归 线性模型的几种表现形式分析(40页珍藏版)》请在金锄头文库上搜索。

1、LOGISTIC 回归,线性模型一般线性模型,线性模型广义线性模型,线性模型的条件,LINE L Linear I Independence N Normal distribution E Equal variance,LOGISTIC 模型,二值变量(0,1)资料的logit变换 设P为事件发生的概率,事件发生的优势odds和样本率的关系,图 1 事件发生的优势odds和样本率的关系,图 2 logit 函数图,图 2 logit 函数图,图 3 logistic曲线,例1. 饮酒与高血压,Data a; Input y drink a1 a2 a3 a4 a5 count; Cards;

2、1 1 0 0 0 0 0 1 1 0 0 0 0 0 0 0 1 1 1 0 0 0 0 4 1 0 1 0 0 0 0 5 1 1 0 1 0 0 0 25 1 0 0 1 0 0 0 21 1 1 0 0 1 0 0 42 1 0 0 0 1 0 0 34 1 1 0 0 0 1 0 19 1 0 0 0 0 1 0 36 1 1 0 0 0 0 1 5 1 0 0 0 0 0 1 8 0 1 0 0 0 0 0 9 0 0 0 0 0 0 0 106 0 1 1 0 0 0 0 26 0 0 1 0 0 0 0 164 0 1 0 1 0 0 0 29 0 0 0 1 0 0 0 13

3、8 0 1 0 0 1 0 0 27 0 0 0 0 1 0 0 138 0 1 0 0 0 1 0 18 0 0 0 0 0 1 0 88 0 1 0 0 0 0 1 0 0 0 0 0 0 0 1 31 ; proc logistic descending; freq count; model y=a1 a2 a3 a4 a5 drink; run;,SAS 程序1,例1 SAS结果解释-变量赋值,Response Profile Ordered Total Value y Frequency 1 1 200 2 0 774 Probability modeled is y=1.,模型中假

4、(哑)变量的定义问题,模型中假变量的向量表示,或,参数估计及模型检验,最大似然法:使似然函数L达到最大。 拟合优度检验: H0:模型拟合观察资料; H1:模型不拟合观察资料。 拟合优度检验统计量: -2ln(L) 在大样本条件下近似服从=N-m-1的2分布,变量筛选,似然比检验(最常用) 记分检验: 统计量:SCORE (公式略) Wald检验,例1 模型检验统计量,Model Fit Statistics Intercept Intercept and Criterion Only Covariates AIC 991.029 802.456 SC 995.910 836.626 -2 Lo

5、g L 989.029 788.456,例1 模型检验结果,Testing Global Null Hypothesis: BETA=0 Test Chi-Square DF Pr ChiSq Likelihood Ratio 200.5731 6 .0001 Score 183.5523 6 .0001 Wald 125.0228 6 .0001,例1 模型吻合情况,Association of Predicted Probabilities and Observed Responses Percent Concordant 75.1 Somers D 0.594 Percent Disco

6、rdant 15.7 Gamma 0.654 Percent Tied 9.1 Tau-a 0.194 Pairs 154800 c 0.797,例1 结果参数估计,Standard Wald Parameter DF Estimate Error Chi-Square Pr ChiSq Intercept 1 -5.0534 1.0094 25.0637 .0001 a1 1 1.5426 1.0659 2.0944 0.1478 a2 1 3.1990 1.0231 9.7763 0.0018 a3 1 3.7182 1.0185 13.3264 0.0003 a4 1 3.9667 1.

7、0230 15.0337 0.0001 a5 1 3.9616 1.0650 13.8375 0.0002 drink 1 1.6671 0.1896 77.2908 .0001,例1结果优势比,Odds Ratio Estimates Point 95% Wald Effect Estimate Confidence Limits a1 4.677 0.579 37.774 a2 24.508 3.299 182.048 a3 41.190 5.595 303.229 a4 52.810 7.110 392.225 a5 52.543 6.516 423.683 drink 5.297 3.

8、653 7.681,参数的意义,优势 / 对数优势 优势比,常数项与预测和判别的关系,病例对照研究中,常数项不代表各 变量取值为零时人群患病OR估计值的对数。不可用于预测和判别!,条件logistic模型,匹配资料的问题 根据Bayes公式 推出,例2:1:1配对设计,胃癌与三种生活因素,每个病例按年龄 、性别和居住地取健康对照,调查3种生活因素 X1:不良饮食习惯 X2:爱吃卤、腌制品 X3:精神状态,data a; input no y x1 x2 x3; cards; 1 0 2 4 0 1 1 3 1 0 2 0 3 2 1 2 1 0 1 0 3 0 3 0 0 3 1 2 0 1

9、(略) 49 0 1 2 1 49 1 0 0 1 50 0 2 0 1 50 1 0 3 1 ; proc phreg; model y=x1 x2 x3/selection=stepwise slentry=0.05; strata no; run;,SAS 程序2,例2 条件logistic sas结果参数估计,Analysis of Maximum Likelihood Estimates Parameter Standard Hazard Var DF Estimate Error Chi-Sq Pr ChiSq Ratio x1 1 0.78547 0.25686 9.3513 0

10、.0022 2.193 x2 1 0.81411 0.30679 7.0420 0.0080 2.257,例2 条件logistic sas结果变量筛选,Testing Global Null Hypothesis: BETA=0 Test Chi-Square DF Pr ChiSq Likelihood Ratio 22.0017 2 .0001 Score 17.9046 2 0.0001 Wald 12.4144 2 0.0020 NOTE: No (additional) variables met the 0.05 level for entry into the model.,例

11、2 条件logistic sas结果变量全部入选,Analysis of Maximum Likelihood Estimates Parameter Standard Hazard Var DF Estimate Error Chi-Sq Pr ChiSq Ratio x1 1 0.82351 0.26700 9.5130 0.0020 2.278 x2 1 0.82561 0.31141 7.0290 0.0080 2.283 x3 1 0.49890 0.51744 0.9296 0.3350 1.647,有序多分类logistic模型,累积logistic模型: 设结果变量y有c个等级

12、, 如 1显效;2有效;3无效 则用c-1个方程描述y与x的关系,累积模型 程序3,data a; input y x1 x2 count; cards; 1 1 1 16 1 0 1 5 2 1 1 5 2 0 1 2 3 1 1 6 3 0 1 7 1 1 0 6 1 0 0 1 2 1 0 7 2 0 0 0 3 1 0 19 3 0 0 10 ; proc logistic; freq count; model y= x1 x2/scale=none aggregate; run;,X1 性别 x2 方法 y 疗效: 1 显效 2 有效 3无效,有序多分类变量赋值,Response P

13、rofile Ordered Total Value y Frequency 1 1 28 2 2 14 3 3 42,累积logistic模型参数估计例,Analysis of Maximum Likelihood Estimates Standard Wald Parameter DF Estimate Error Chi-Sq Pr ChiSq Intercept 1 1 -2.6671 0.5997 19.7800 .0001 Intercept 2 1 -1.8127 0.5566 10.6064 0.0011 x1 1 1.3187 0.5292 6.2096 0.0127 x2

14、1 1.7973 0.4728 14.4493 0.0001,X1 性别 x2 方法 y 疗效: 1 显效 2 有效 3无效,两个方程,LogitP(Y=1|x=-2.667+1.318x1+1.797x2 LogitP(Y=2|x=-1.813+1.318x1+1.797x2 问一女性病人使用新疗法的预期疗效? 将x1=1 x2=1代入方程 得 LogitP(Y=1|x)=0.448 LogitP(Y=2|x)=1.302 P(Y=1|x)=0.61 P(Y=2|x)=0.79 结果:此人显效0.61 有效0.18 无效0.21,无序多分类logistic模型,设结果变量y有c个等级, 如 1鳞癌;2腺癌;3大细胞癌 则用c-1个方程描述y与x的关系,分化程度、染色和组织类型,程序4无序分类模型

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号