各种回归模型适用条件logistic回归.ppt

上传人:夏** 文档编号:571259320 上传时间:2024-08-09 格式:PPT 页数:40 大小:167.50KB
返回 下载 相关 举报
各种回归模型适用条件logistic回归.ppt_第1页
第1页 / 共40页
各种回归模型适用条件logistic回归.ppt_第2页
第2页 / 共40页
各种回归模型适用条件logistic回归.ppt_第3页
第3页 / 共40页
各种回归模型适用条件logistic回归.ppt_第4页
第4页 / 共40页
各种回归模型适用条件logistic回归.ppt_第5页
第5页 / 共40页
点击查看更多>>
资源描述

《各种回归模型适用条件logistic回归.ppt》由会员分享,可在线阅读,更多相关《各种回归模型适用条件logistic回归.ppt(40页珍藏版)》请在金锄头文库上搜索。

1、LOGISTIC 回归回归线性模型线性模型一般线性模型一般线性模型线性回归线性回归方差分析方差分析协方差分析协方差分析响应变量响应变量连续,正态连续,正态连续,正态连续,正态连续,正态连续,正态解释变量解释变量连续连续离散离散连续和离散连续和离散连接函数连接函数恒等式恒等式恒等式恒等式恒等式恒等式SAS实现实现REG/GLMMIXEDANOVA /MIXED GLM / GENMOD GLM / MIXEDGENMOD 线性模型线性模型广义线性模型广义线性模型logistic回归回归对数线性模型对数线性模型响应变量响应变量离散型,离散型, B(n,)事件发生频数事件发生频数解释变量解释变量离散

2、型,连续型离散型,连续型分类变量分类变量联接函数联接函数logit lnP/(1-P)log线性模型的条件线性模型的条件LINE L Linear I Independence N Normal distribution E Equal varianceLOGISTIC 模型模型二值二值变量(变量(0,1)资料的)资料的logit变换变换 设设P为事件发生的概率为事件发生的概率事件发生的优势事件发生的优势odds和和样本率的关系样本率的关系图图 1 事件发生的优势事件发生的优势odds和样本率的关系和样本率的关系图 2 logit 函数图图图 2 logit 函数图函数图图 3 logisti

3、c曲线例例1. 饮酒与高血压饮酒与高血压年龄组年龄组25357585高血压高血压+饮饮 +酒酒 194265001065164831Data a;Data a;Input y drink a1 a2 a3 a4 a5 count;Input y drink a1 a2 a3 a4 a5 count;Cards;Cards;1 1 0 0 0 0 0 1 1 0 0 0 0 0 0 01 1 0 0 0 0 0 1 1 0 0 0 0 0 0 01 1 1 0 0 0 0 4 1 0 1 0 0 0 0 51 1 1 0 0 0 0 4 1 0 1 0 0 0 0 51 1 0 1 0 0 0

4、25 1 0 0 1 0 0 0 211 1 0 1 0 0 0 25 1 0 0 1 0 0 0 211 1 0 0 1 0 0 42 1 0 0 0 1 0 0 341 1 0 0 1 0 0 42 1 0 0 0 1 0 0 341 1 0 0 0 1 0 19 1 0 0 0 0 1 0 361 1 0 0 0 1 0 19 1 0 0 0 0 1 0 361 1 0 0 0 0 1 5 1 0 0 0 0 0 1 81 1 0 0 0 0 1 5 1 0 0 0 0 0 1 80 1 0 0 0 0 0 9 0 0 0 0 0 0 0 1060 1 0 0 0 0 0 9 0 0 0

5、 0 0 0 0 1060 1 1 0 0 0 0 26 0 0 1 0 0 0 0 1640 1 1 0 0 0 0 26 0 0 1 0 0 0 0 1640 1 0 1 0 0 0 29 0 0 0 1 0 0 0 1380 1 0 1 0 0 0 29 0 0 0 1 0 0 0 1380 1 0 0 1 0 0 27 0 0 0 0 1 0 0 1380 1 0 0 1 0 0 27 0 0 0 0 1 0 0 1380 1 0 0 0 1 0 18 0 0 0 0 0 1 0 880 1 0 0 0 1 0 18 0 0 0 0 0 1 0 880 1 0 0 0 0 1 0 0

6、0 0 0 0 0 1 310 1 0 0 0 0 1 0 0 0 0 0 0 0 1 31; ;proc logistic descending;proc logistic descending;freq count;freq count;model y=a1 a2 a3 a4 a5 drink;model y=a1 a2 a3 a4 a5 drink;run;run;SAS 程序1例1 SAS结果解释-变量赋值ResponseProfileOrderedTotalValueyFrequency1120020774Probabilitymodeledisy=1.模型中假(哑)变量的定义问题模

7、型中假(哑)变量的定义问题年龄组年龄组25354555657585Age123456a1010000a2001000a3000100a4000010a5000001模型中假变量的向量表示模型中假变量的向量表示 或参数估计及模型检验参数估计及模型检验最大似然法:使似然函数最大似然法:使似然函数L达到最大。达到最大。拟合优度检验:拟合优度检验: H0:模型拟合观察资料;模型拟合观察资料; H1:模型不拟合观察资料。模型不拟合观察资料。 拟合优度检验统计量:拟合优度检验统计量: -2ln(L) 在大样本条件下近似服从在大样本条件下近似服从=N-m-1的的2分布分布 变量筛选变量筛选似然比检验(最常用

8、)似然比检验(最常用)记分检验记分检验: 统计量:统计量:SCORE (公式略)公式略)Wald检验检验例例1 模型检验统计量模型检验统计量ModelFitStatisticsInterceptInterceptandCriterionOnlyCovariatesAIC991.029802.456SC995.910836.626-2LogL989.029788.456例例1 模型检验结果模型检验结果TestingGlobalNullHypothesis:BETA=0TestChi-SquareDFPrChiSqLikelihoodRatio200.57316.0001Score183.5523

9、6.0001Wald125.02286ChiSqIntercept1-5.05341.009425.0637.0001a111.54261.06592.09440.1478a213.19901.02319.77630.0018a313.71821.018513.32640.0003a413.96671.023015.03370.0001a513.96161.065013.83750.0002drink11.66710.189677.2908ChiSqRatiox110.785470.256869.35130.00222.193x210.814110.306797.04200.00802.257

10、例例2 条件条件logistic sas结果结果变量筛选变量筛选TestingGlobalNullHypothesis:BETA=0TestChi-SquareDFPrChiSqLikelihoodRatio22.00172ChiSqRatiox110.823510.267009.51300.00202.278x210.825610.311417.02900.00802.283x310.498900.517440.92960.33501.647有序多分类有序多分类logistic模型模型累积累积logistic模型:模型: 设结果变量设结果变量y有有c个等级,个等级, 如如 1显效;显效;2有

11、效;有效;3无效无效 则用则用c-1个方程描述个方程描述y与与x的关系的关系累累积积模模型型程程序序3data a;input y x1 x2 count;cards;1 1 1 16 1 0 1 52 1 1 5 2 0 1 23 1 1 6 3 0 1 71 1 0 6 1 0 0 12 1 0 7 2 0 0 03 1 0 19 3 0 0 10;proc logistic;freq count;model y= x1 x2/scale=none aggregate;run;X1 性别性别 x2 方法方法 y 疗效:疗效: 1 显效显效 2 有效有效 3无效无效有序多分类有序多分类变量赋

12、值变量赋值ResponseProfileOrderedTotalValueyFrequency112822143342累积累积logistic模型参数估计例模型参数估计例AnalysisofMaximumLikelihoodEstimatesStandardWaldParameterDFEstimateErrorChi-SqPrChiSqIntercept11-2.66710.599719.7800.0001Intercept21-1.81270.556610.60640.0011x111.31870.52926.20960.0127x211.79730.472814.44930.0001X1

13、 性别性别 x2 方法方法 y 疗效:疗效: 1 显效显效 2 有效有效 3无效无效两个方程LogitP(Y=1|x=-2.667+1.318x1+1.797x2LogitP(Y=2|x=-1.813+1.318x1+1.797x2 问一女性病人使用新疗法的预期疗效?问一女性病人使用新疗法的预期疗效? 将将x1=1 x2=1代入方程代入方程 得得 LogitP(Y=1|x)=0.448 LogitP(Y=2|x)=1.302 P(Y=1|x)=0.61 P(YChiSqIntercept1-0.98260.57072.960.08512-0.34610.54130.410.5226x110.6

14、2810.179912.190.000520.34540.17284.000.0456x21-0.64940.28335.260.02192-0.63520.27255.430.0197Logistic 模型的应用和问题模型的应用和问题应用应用筛选危险因素筛选危险因素 / 校正混杂因素校正混杂因素 / 预测与判别预测与判别问题问题1 样本量不能太小样本量不能太小2 不应单纯依赖程序筛选变量,注意变量的医学意义不应单纯依赖程序筛选变量,注意变量的医学意义3 自变量的类型和参数意义的解释问题自变量的类型和参数意义的解释问题4 多数情况下,模型常数项没有意义多数情况下,模型常数项没有意义5 条件条件logistic模型不能用于预测模型不能用于预测

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号