《logistic回归》PPT课件

上传人:资****亨 文档编号:144364808 上传时间:2020-09-08 格式:PPT 页数:44 大小:1.60MB
返回 下载 相关 举报
《logistic回归》PPT课件_第1页
第1页 / 共44页
《logistic回归》PPT课件_第2页
第2页 / 共44页
《logistic回归》PPT课件_第3页
第3页 / 共44页
《logistic回归》PPT课件_第4页
第4页 / 共44页
《logistic回归》PPT课件_第5页
第5页 / 共44页
点击查看更多>>
资源描述

《《logistic回归》PPT课件》由会员分享,可在线阅读,更多相关《《logistic回归》PPT课件(44页珍藏版)》请在金锄头文库上搜索。

1、.,1,Logistic 回归,.,2,筛选影响因素 校正混杂效应 进行疾病预测,医学研究,线性回归,因变量连续定量变量,自变量与应变量为线性关系,Logistic回归,因变量为分类变量,自变量与因变量为非线性关系,.,3,目的:作出以多个自变量(危险因素)估计应 变量(结果因素)的logistic回归方程。属于概率型非线性回归。,Logistic回归,适用范围,资料:1. 应变量为反映某现象发生与不发生的二值变量; 2. 自变量宜全部或大部分为分类变量,可有少数数值变量。分类变量要数量化。,.,4,Logistic回归,适用范围,用途:研究某种疾病或现象发生和多个危险因素(或保护因子)的数量

2、关系。 用 检验(或u检验)的局限性: 1.只能研究1个危险因素; 2.只能得出定性结论。,.,5,分类,Logistic回归,多分类资料logistic回归:因变量多分类变量,二分类资料logistic回归:因变量二分类变量,多项分类logistic回归模型或有序分类logistic回归模型,非条件logistic回归-非配比病例-对照研究或队列研究,条件logistic回归-配对或配比资料,.,6,统计学概念,队列研究,相对危险度(RR),病例对照研究,危险度,比数比或优势比(OR),.,7,队列研究,也称前瞻性研究、随访研究等。是一种由因及果的研究,在研究开始时,根据以往有无暴露经历,将

3、研究人群分为暴露人群和非暴露人群,在一定时期内,随访观察和比较两组人群的发病率或死亡率。如果两组人群发病率或死亡率差别有统计学意义,则认为暴露和疾病间存在联系。,Logistic回归,.,8,相对危险度,Logistic回归,RR(相对危险度relative risk):表示暴露组与非暴露组发病率(或死亡率)的比值。也称为危险比(risk ratio)。反映了暴露与疾病发生的关联强度。 RR表明暴露组发病或死亡的危险是非暴露组的多少倍。,.,9,相对危险度,Logistic回归,RR1:表示该因素为危险因素,使发病危险度增大 RR1:表示该因素为保护因素,使发病危险度减小 RR=1:表示该因素

4、对疾病的发病无影响。,.,10,病例对照研究,Logistic回归,一种由果及因的回顾性研究,先按疾病状态确定调查对象,分为病例和对照两组,然后利用已有的记录、或采用询问、填写调查表等方式,了解其发病前的暴露情况,并进行比较,推测疾病与暴露间的关系。,.,11,比数比,Logistic回归,.,12,比数比,Logistic回归,相对危险度RR的本质是暴露组与非暴露组发病率之比或发病概率之比。但病例对照研究不能计算发病率,只能计算比值比OR值。OR与RR的含义是相同的,也是指暴露组的疾病危险性为非暴露组的多少倍。当疾病发病率小于5%时,OR是RR的极好近似值。,OR1,说明 该因素是疾病的危险

5、性增加,为危险因素;OR1,说明 该因素是疾病的危险性减小,为保护因素;,.,13,举例,Logistic回归,例: 为了探讨冠心病发生的有关危险因素,对26例冠心病病人和28例对照者进行病例对照研究,调查记录了8个可能的危险因素,试用Logistic逐步回归分析方法筛选危险因素,并分析各自变量的作用大小。,.,14,举例,Logistic回归,冠心病8个可能的危险因素与编码说明,.,15,举例,Logistic回归,冠心病危险因素病例对照研究原始数据,.,16,模型,Logistic回归,在m个自变量的作用下阳性结果发生的概率记作:,.,17,举例,Logistic回归,Logistic模型

6、还有另一种线性化表达形式,称为Logit模型:,.,18,模型,Logistic回归,常数项: 表示暴露剂量 为0时个体发病与不发病概率之比的自然对数。 回归系数: 表示自变量 改变一个单位时Logitic(P )的改变量。,.,19,比数比(OR),Logistic回归,流行病学衡量危险因素作用大小的比数比指标。计算公式为:,.,20,OR与 Logitic(P )的关系,Logistic回归,j 表示 ORj 的自然对数值。,.,21,模型意义,Logistic回归,.,22,模型意义,Logistic回归,对于发病率很低的慢性疾病如心脑血管病、恶性肿瘤等,优势比可作为相对危险度(rela

7、tive risk ,RR)的近似估计。 即,.,23,假设检验,Logistic回归,检验假设为: H0:所有 H1:,常用的检验方法有以下三种: 似然比检验 Wald检验 记分检验,.,24,似然比检验,Logistic回归,原理:最大似然( likelihood )估计,-2lnL近似服从 分布 G = 2(lnL1-lnL0)= 2ln(L1/L0) =p-l,自变量X引入回归方程L0、L1 若L0/L1=1,则接受H1,拒绝H0.,.,25,似然比检验,Logistic回归,具体方法是: 先拟合不包含待检验因素的logistic模型,求对数似然函数值; 再拟合包含待检验因素的logi

8、stic模型,求另一个对数似然函数值; 比较两个对数似然函数值差别的大小,.,26,Wald检验,Logistic回归,.,27,记分检验,Logistic回归,以未包含某个或几个变量的模型计算保留模型中参数的估计值,并假设新增参数为零,计算似然函数的一价偏导数及信息距阵,两者相乘便得比分检验的统计量S 。n 较大时, S近似服从自由度为待检因素个数的分布。,.,28,比较,Logistic回归,以上三种方法中,在多数情况下,似然比检验是最有效的检验,记分检验一般与它相一致。但两者计算量均较大; Wald检验主要用于对单个回归系数的检验,但是Wald检验未考虑各因素间的综合作用,比较保守,在因

9、素间有共线性存在时,结果不像其它两者可靠。,.,29,一般过程,Logistic回归,变量的选择 建立logistic回归模型时,要求进入模型的自变量应对反应变量有解释能力。通常研究者根据专业知识和研究的问题,首先确定要研究的反应变量和自变量 单因素分析(变量的粗略选择) 用单因素分析对自变量进行筛选:卡方检验、t检验或单因素的logistic回归,.,30,一般过程,Logistic回归,.,31,条件logistic回归,Logistic回归,病例与对照匹配 即要求对照在某些因素或特征上与病例保持一致,目的是对两组比较时排除混杂因素的干扰。匹配分为成组匹配和个体匹配。,.,32,条件log

10、istic回归,Logistic回归,1、成组匹配(category matching):匹配的因素所占的比例,在对照组和在病例组一致。如病例组中男女各半,65岁以上者占1/3,则对照组也是如此。 2、个体匹配(individual matching):以病例和对照的个体为单位进行匹配叫个体匹配,每一个病例与M个与它条件相一致的对照形成一个匹配组。1:1匹配又叫配对(pair matching), 1:2, ,1:m匹配时称为匹配。 匹配的特征必须是已知的混杂因子,或者有充分的理由怀疑其为混杂因子,否则不应匹配。,.,33,条件logistic回归,Logistic回归,.,34,应用,Log

11、istic回归,矫正混杂因素 筛选影响因素 疾病预测和预后,.,35,ROC曲线,.,36,涵义与起源,ROC曲线,ROC【receiver(relative) operating characteristic的缩写,译为“接受者工作特征”】 ROC曲线研究历史 1950s 雷达信号观测能力评价 1960s中期 实验心理学、心理物理学 1970s末与1980s初 诊断医学,.,37,诊断试验评价四格表,ROC曲线,灵敏度:真阳性率,表示实际患病者且被待评价的诊断方法诊断为患者的概率,反映了待评价的诊断方法检出患者能力Se=a/(a+c) 特异度:真阴性率,表示实际未患病患者且被待评价的诊断方法

12、诊断为非患者的概率,反映了待评价的诊断方法检出非患者的能力Sp=d/(b+d),.,38,ROC曲线,ROC曲线,1-特异度,灵敏度,ROC曲线分析中将不同诊断分界点下的灵敏度和(1-特异度)确定为曲线上的一个操作点,灵敏度为纵坐标,(1-特异度)为横坐标。,参考线,.,39,曲线下面积,ROC曲线,ROC曲线下面积(AUC):用于定量地反应诊断试验的准确性大小。取值范围0.51.,ROC曲线下面积(Area)与诊断准确度高低 高 0.90-1.00 = excellent (A) 中 0.80-0.90 = good (B) 0.70-0.80 = fair (C) 低 0.60-0.70 = poor (D) 0.50-0.60 = fail (F),.,40,举例,ROC曲线,例:为评价放射科医生的诊断能力,某医生对60分肺结节(病理结果良性19例,恶性41例)的CT图像进行诊断。诊断结果为肯定良性,可疑良性、难以确定、可疑恶性、肯定恶性5个等级,分别用评分15表示,结果如表所示,试评价该医生利用CT影像诊断肺结节的能力。,.,41,谢谢!,.,42,.,43,.,44,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号