逻辑斯蒂克回归-中南

上传人:第*** 文档编号:57626760 上传时间:2018-10-23 格式:PPT 页数:60 大小:1.01MB
返回 下载 相关 举报
逻辑斯蒂克回归-中南_第1页
第1页 / 共60页
逻辑斯蒂克回归-中南_第2页
第2页 / 共60页
逻辑斯蒂克回归-中南_第3页
第3页 / 共60页
逻辑斯蒂克回归-中南_第4页
第4页 / 共60页
逻辑斯蒂克回归-中南_第5页
第5页 / 共60页
点击查看更多>>
资源描述

《逻辑斯蒂克回归-中南》由会员分享,可在线阅读,更多相关《逻辑斯蒂克回归-中南(60页珍藏版)》请在金锄头文库上搜索。

1、第十六章 logistic回归分析,(logistic regression),讲述内容 第一节 logistic回归 第二节 条件logistic回归 第三节 logistic回归的应用及其注意事项,目的:作出以多个自变量(危险因素)估计应变量(结果因素)的logistic回归方程。属于概率型非线性回归。 资料:1. 应变量为分类变量;2. 自变量宜全部或大部分为分类变量,可有少数数值变量。分类变量要数量化。,用途:研究某种疾病或现象发生和多个危 险因素(或保护因子)的数量关系。用 检验(或u检验)的局限性:1.只能研究1个危险因素;2.只能得出定性结论。,种类:1. 成组(非条件)logi

2、stic回归方程。2. 配对(条件)logistic回归方程。,Logistic回归的分类二分类 有序反应变量多分类 无序反应变量非条件(成组) 1:1配对资料条件(配对)Logistic回归 1:m配对资料m:n配对资料,第一节 logistic回归 (非条件logistic回归 ),一、基本概念,,,在m个自变量的作用下阳性结果发生的概率记作,若令,回 归 模 型,若令,回 归 模 型,概率P:01,logitP:。,取值范围,当Z+时, P值渐近于1; 当Z值-时, P值渐近于0;,P值的变化在01范围之内,并且随Z值的增加或减少以点(0,0.5)为中心呈对称S形变化。,模 型 参 数

3、的 意 义,流行病学衡量危险因素作用大小的比数比例指标。计算公式为:,优势比OR(odds ratio),与logisticP的关系:,二、logistic回归模型的参数估计,参数估计 原理:最大似然( likelihood )估计,2. 优势比估计 可反映某一因素两个不同水平(c1,c0)的优势比。,例16-1 表16-1是一个研究吸烟、饮酒与食道癌关系的病例对照资料,试作logistic回归分析。,确 定 各 变 量 编 码,表16-1 吸烟与食道癌关系的病例对照调查资料,三、logistic回归模型的假设检验,1.似然比检验 2. Wald检验 3.计分检验,24,1.似然比检验,零假设

4、:加入的自变量的总体回归系数=0,具体方法:,(1)先拟合一个不包含准备检验的变量在内的logistic回归模型,得到对数似然函数值lnL0 (设包含的自变量个数为l 个); (2)加入准备检验的变量,重新拟合logistic回归模型,同时又得到一个对数似然函数值lnL1 (设包含的自变量个数为p 个); (3)计算似然比统计量G:G=2(lnL1- lnL0) (16-12),25,=0.05,=0.05,26,2.,3.计分检验(score test) 需要进行矩阵运算,27,方法:前进法、后退法和逐步法。 检验统计量:不是 F 统计量,而是似然比统计量、 Wald 统计量和计分统计量之一

5、。,四、变量筛选,例16-2 为了探讨冠心病发生的有关危险因素,对26例冠心病病人和28例对照者进行病例对照研究,各因素的说明及资料见表16-2和表16-3。试用logistic 逐步回归分析方法筛选危险因素。,表16-2 冠心病8个可能的危险因素与赋值,表16-3 冠心病危险因素的病例对照调查资料,表16-4 例16-2进入方程中的自变量及有关参数的估计值,学会看结果!,第二节 条件logistic回归,一、原理,表16-5 1: M 条件logistic回归数据的格式,* t = 0 为病例,其他为对照,条件 logistic 模型,二、应用实例,表16-7 喉癌1:2配对病例对照调查资料

6、整理表,P344,表16-8 例16-3进入方程中的自变量及有关参数的估计值,采用逐步法,6个危险因素 变量筛选 4个进方程,结果见表16-9。,Logistic回归与多元线性回归的区别和联系?,多元线性回归的模型:Logistic回归的模型:,相同点,Logistic回归和多元线性模型均为广义线性模型; 都是反映一个因变量和多个自变量之间的关系; 都可以控制混杂因素的影响。,不同点,第三节 logistic回归的应用及其注意事项,45,第三节 有序logistic回归和无序多分类logistic回归,基本概念: 1、有序logistic回归应变量Y为等级或成都差别变量。基于累积概率构建模型。

7、 2、多分类logistic回归应变量Y为无序分类变量,是两分类logistic回归的扩展。以选择的某类别为参照,剩余类别相对于此参照类别的logistic回归分析。,一、logistic回归的应用,1流行病学危险因素分析2临床试验数据分析 3分析药物或毒物的剂量反应 4预测与判别,第四节 logistic回归的应用及其注意事项,47,一、logistic回归的应用 1流行病学危险因素分析logistic回归分析的特点之一是参数意义清楚,即得到某一因素的回归系数后,可以很快估计出这一因素在不同水平下的优势比或近似相对危险度,因此非常适合于流行病学研究。logistic回归既适合于队列研究(co

8、hort study),也适合于病例-对照研究(case-control study),同样还可以用于断面研究(cross-sectional study),48,2临床试验数据分析当评价某种药物或治疗方法的效果的评价指标为二值变量时(如有效和无效),影响效果的非处理因素(如年龄、病情等)在试验组和对照组中分布不均衡,就有可能夸大或掩盖试验组的治疗效果。,尽管在分组时要求按随机化原则分配,但由于样本含量有限,非处理因素在试验组和对照组内的分布仍有可能不均衡,在分析阶段对构成混杂的非处理因素进行调整利用logistic回归分析(得到调整的 ),对于按分层设计的临床试验可以用相同的方法对分层因素进

9、行调整和分析。,49,3分析药物或毒物的剂量反应,用这一模型可以求出任一剂量的阳性反应率,传统的方法:对实验设计有严格的要求,如剂量按等比级数排列,各剂量组的例数必须相同等, logistic回归的方法:没有这些限制。,剂量为X时的阳性率,P 与剂量之间的关系:,1)不同剂量使动物发生“阳性反应”的概率分布常呈正偏态。 2)当将剂量取对数后则概率分布接近正态分布。由于正态分布函数与logistic分布函数都是指数函数,十分接近,所以:,50,4预测与判别,logistic回归模型概率型模型 作用:预测某事件发生的概率。,例如:在临床上可以根据患者的一些检查指标,判断患某种疾病的概率有多大。关于

10、判别问题见第十八章。,51,二、logistic回归应用的注意事项,52,3、变量选择(逐步回归的方法),实际:根据专业知识、研究目的选择变量。,选择最佳自变量的组合(探索性研究):然似比检验,分析某一个变量是否有统计学意义(验证性研究):然似比检验、Wald检验、计分检验,53,4、有序logistic回归的平行性假设检验,5、SPSS和SAS中有序logistic回归结果的区别,54,6、模型的拟合优度检验目的:检验模型与实际数据的符合情况。拟合优度高,说明自变量的预测能力强。方法:主要有3种。,(1)偏差,(2)Pearson,(3)广义决定系数,55,(1)偏差(deviance ,D

11、):D值概括样本数据与logistic模型的拟合程度。,(2)Pearson :,大样本资料,两个统计量都服从自由度=g-p-1的卡方分布。 (当小样本时,偏离卡方分布,用D与自由度比较,当D自由度,提示不够理想。),56,57,(3)广义决定系数(综合性指标)类似于多元线性回归中的决定系数。,58,本章小结:,目的:作出以多个自变量(危险因素)估计应变量(结果因素)的logistic回归方程。属于概率型非线性回归。 资料:1. 应变量为反映某现象发生与不发生的二值变量;2. 自变量宜全部或大部分为分类变量,可有少数数值 变量。分类变量要数量化。,用途:研究某种疾病或现象发生和多个危险因素(或

12、保护因子)的数量关系。,种类: 1. 成组(非条件)logistic回归方程。2. 配对(条件)logistic回归方程。,59,课后应用思考题:为了分析影响医院抢救急性心肌梗死(AMI)患者能否成功的因素,某医院收集了5年中所有的AMI患者的抢救病史(有关因素很多,由于篇幅有限,本例仅列出3个),共200例见下表。其中P=0表示抢救成功,P=1表示抢救未成功而死亡;X1=1表示抢救前已发生休克, X1=0表示抢救前未发生休克; X2=1表示抢救前已发生心衰, X2=0表示抢救前未发生心衰; X3=1表示患者从开始AMI症状到抢救时已超过12小时, X3=0表示患者从开始AMI症状到抢救时未超过12小时。请问最好采用哪种分析方法?为什么?分析结果有哪些?,60,AMI患者的抢救危险因素资料,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号