第12讲 Logistic回归分析

上传人:洪易 文档编号:34306598 上传时间:2018-02-23 格式:PPT 页数:65 大小:1.87MB
返回 下载 相关 举报
第12讲 Logistic回归分析_第1页
第1页 / 共65页
第12讲 Logistic回归分析_第2页
第2页 / 共65页
第12讲 Logistic回归分析_第3页
第3页 / 共65页
第12讲 Logistic回归分析_第4页
第4页 / 共65页
第12讲 Logistic回归分析_第5页
第5页 / 共65页
点击查看更多>>
资源描述

《第12讲 Logistic回归分析》由会员分享,可在线阅读,更多相关《第12讲 Logistic回归分析(65页珍藏版)》请在金锄头文库上搜索。

1、第三军医大学军事预防医学院卫生统计学教研室第三军医大学军事预防医学院卫生统计学教研室Department of Health statistics ,TMMU Tel: 68752343 13996478364授课对象:授课对象: 2010级研究生级研究生 任课教员:张彦琦任课教员:张彦琦 讲师讲师医学统计学医学统计学Medical Statistics第十六章第十六章 Logistic回归分析回归分析Logistic Regression Analysis 第一节第一节 非条件非条件 Logistic回归分析回归分析第二节第二节 条件条件 Logistic回归分析回归分析教学内容教学内容第三

2、节第三节 Logistic回归分析的应用回归分析的应用及注意事项及注意事项流行病学概念回顾流行病学概念回顾卫生统计学教研室 张彦琦掌握了解 1. Logistic回归参数估计的基本思想回归参数估计的基本思想2. Logistic回归系数的假设检验和区间估计方法回归系数的假设检验和区间估计方法教学目标1. Logistic回归分析结果及解释回归分析结果及解释2. Logistic回归变量筛选方法回归变量筛选方法3. Logistic回归系数的流行病学意义回归系数的流行病学意义4. Logistic回归的应用及注意事项回归的应用及注意事项理解 非条件非条件 Logistic回归和条件回归和条件 L

3、ogistic回归的回归的区别区别卫生统计学教研室 张彦琦几个重要的流行病学概念 病因分析病因分析 (预后分析)的目的:找出影响疾(预后分析)的目的:找出影响疾病发生(或预后好坏)的影响因素及其影响的强病发生(或预后好坏)的影响因素及其影响的强度。度。如果某因素对疾病发生有影响,就称该因素如果某因素对疾病发生有影响,就称该因素与疾病的发生有与疾病的发生有 关联关联 ,关联的强度则反映其对疾,关联的强度则反映其对疾病发生影响的大小。病发生影响的大小。卫生统计学教研室 张彦琦几个重要的流行病学概念v队列研究( cohort study)v病例对照研究( case-control study) v危

4、险度( risk)v相对危险度( relative risk, RR) v比数比或优势比( odds ratio, OR) 卫生统计学教研室 张彦琦队列研究队列研究(队列研究( cohort study) : 对对 “ 因因 ” 分类上分类上的人群作追踪随访,观察其的人群作追踪随访,观察其 “ 果果 ” ,然后对资料,然后对资料进行比较分析,从而判断进行比较分析,从而判断 “ 因因 ” 与与 “ 果果 ” 之间有之间有无关联及关联的强度。无关联及关联的强度。患病患病 未患病未患病暴露组暴露组非暴露组非暴露组卫生统计学教研室 张彦琦病例对照研究病例对照研究(病例对照研究( case-contro

5、l study):): 是对是对 “ 果果” 分类上的人群作回顾性调查,观察其分类上的人群作回顾性调查,观察其 “ 因因 ” ,然,然后对资料进行比较分析,从而判断后对资料进行比较分析,从而判断 “ 果果 ” 与与 “ 因因 ”间关联有无统计学意义及关联的强度。间关联有无统计学意义及关联的强度。暴露暴露 未暴露未暴露病例病例对照对照卫生统计学教研室 张彦琦危险度 危险度(危险度( risk) :通常指某个不幸事件发生的概:通常指某个不幸事件发生的概率。危险度大表示发生的可能性大。率。危险度大表示发生的可能性大。某病发病危险度某病发病危险度 :观察对象在观察期间内发生某:观察对象在观察期间内发生

6、某病的概率,即某病病的概率,即某病 发病率发病率 。卫生统计学教研室 张彦琦相对危险度 vRR 1:表示该因素为危险因素,使发病危险度增大。:表示该因素为危险因素,使发病危险度增大。vRR 1:表示该因素为保护因素,使发病危险度减小。:表示该因素为保护因素,使发病危险度减小。vRR=1:表示该因素对疾病的发病无影响。:表示该因素对疾病的发病无影响。相对危险度(相对危险度( relative risk, RR) :暴露于某种:暴露于某种危险因子的发病率危险因子的发病率 pe 与不暴露于该种危险因子的与不暴露于该种危险因子的发病率发病率 p0 之比。之比。卫生统计学教研室 张彦琦相对危险度 患病患

7、病 未患病未患病暴露组暴露组非暴露组非暴露组队列研究队列研究病例对照研究一般不能计算病例对照研究一般不能计算 RR。病例对照研究病例对照研究卫生统计学教研室 张彦琦比数比数 (odds): 发生率与未发生率之比,即发生率与未发生率之比,即 p/(1-p) ,即阳性率即阳性率 /阴性率。阴性率。比数比比数比 ( odds ratio, OR) :两个比数之比,:两个比数之比,即即 ,通常在流行病研究中,通常在流行病研究中p1为病例组的暴露率,为病例组的暴露率, p2为对照组的暴露率。为对照组的暴露率。比数比对发对发 病率较低病率较低 的疾病,一般有的疾病,一般有 RROR卫生统计学教研室 张彦琦

8、比数比患病患病 未患病未患病暴露组暴露组非暴露组非暴露组暴露暴露 未暴露未暴露病例病例对照对照(对发对发 病率较病率较低低 的疾病的疾病 )病例对照研究病例对照研究队列研究队列研究病例对照研究一般用病例对照研究一般用 OR替代替代 RR。卫生统计学教研室 张彦琦一个病例对照研究资料OR卫生统计学教研室 张彦琦 医学研究中常碰到医学研究中常碰到 应变量应变量 的可能取值仅有两的可能取值仅有两个(即个(即 二分类变量二分类变量 ),如发病与未发病、阳性与),如发病与未发病、阳性与阴性、死亡与生存、治愈与未治愈、暴露与未暴阴性、死亡与生存、治愈与未治愈、暴露与未暴露等,显然这类资料不满足多重回归的条

9、件。露等,显然这类资料不满足多重回归的条件。 什么情况下采用 Logistic回归目的:目的: 作出以多个自变量(危险因素)估计应变量作出以多个自变量(危险因素)估计应变量(结果因素)的(结果因素)的 logistic回归方程。属于概率型非回归方程。属于概率型非线性回归。线性回归。资料:资料: 1. 应变量为反映某现象发生与不发生的二值应变量为反映某现象发生与不发生的二值变量;变量;2. 自变量宜全部或大部分为分类变量,可有自变量宜全部或大部分为分类变量,可有少数数值变量。分类变量要数量化。少数数值变量。分类变量要数量化。什么情况下采用 Logistic回归卫生统计学教研室 张彦琦用途: 研究

10、某种疾病或现象发生和多个危险因素(或保护因子)的数量关系。用 检验(或 u检验)的 局限性 :1.只能研究 1个危险因素;2.只能得出定性结论。什么情况下采用 Logistic回归卫生统计学教研室 张彦琦 种类种类 :1. 成组(非条件)成组(非条件) logistic回归方程。回归方程。2. 配对(条件)配对(条件) logistic回归方程。回归方程。什么情况下采用 Logistic回归卫生统计学教研室 张彦琦第一节第一节 Logistic回归分析回归分析Logistic Regression实例表表 16-1 膀胱癌患者及对照吸烟史资料膀胱癌患者及对照吸烟史资料卫生统计学教研室 张彦琦例

11、例 16-2 为了探讨冠心病发生的有关危险因素,对为了探讨冠心病发生的有关危险因素,对26例冠心病病人和例冠心病病人和 28例对照者进行病例例对照者进行病例 对照研究对照研究,调查记录了,调查记录了 8个可能的危险因素,试用个可能的危险因素,试用 Logistic逐逐步回归分析方法筛选危险因素,并分析各自变量的步回归分析方法筛选危险因素,并分析各自变量的作用大小。作用大小。实例卫生统计学教研室 张彦琦表表 16-2 冠心病冠心病 8个可能的危险因素与编码说明个可能的危险因素与编码说明实例实例表表 16-3 冠心病危险因素病例对照研究原始数据冠心病危险因素病例对照研究原始数据Logistic回归

12、模型回归模型在在 m个自变量的作用下阳性结果发生的概率记作个自变量的作用下阳性结果发生的概率记作 :Logit变换变换卫生统计学教研室 张彦琦Logistic回归模型回归模型这就摆脱了二值反应变量在一般线性回归分析中这就摆脱了二值反应变量在一般线性回归分析中可能出现的应变量值域的窘境。可能出现的应变量值域的窘境。卫生统计学教研室 张彦琦Logistic曲线曲线卫生统计学教研室 张彦琦常数项:常数项: 表示暴露剂量表示暴露剂量 为为 0时个体发病与不时个体发病与不发病概率之比的自然对数。发病概率之比的自然对数。回归系数:回归系数: 表示自变量表示自变量 改变一个单位时改变一个单位时 Logit(

13、 P ) 的改变量。的改变量。模型参数的意义模型参数的意义Logistic模型还有另一种线性化表达形式,称为模型还有另一种线性化表达形式,称为Logit模型模型 :卫生统计学教研室 张彦琦 流行病学衡量危险因素作用大小的流行病学衡量危险因素作用大小的 比数比比数比 指标。指标。计算公式为:计算公式为:模型参数的意义模型参数的意义 比数比比数比 OR(odds ratio)卫生统计学教研室 张彦琦模型参数的意义模型参数的意义 OR与与 Logit( P ) 的关系的关系j 表示表示 ORj 的自然对数值。的自然对数值。卫生统计学教研室 张彦琦模型参数的意义模型参数的意义 卫生统计学教研室 张彦琦

14、模型参数的意义模型参数的意义 卫生统计学教研室 张彦琦logistic回归模型的参数估计回归模型的参数估计 原理:最大似然原理:最大似然 ( likelihood )估计估计 参数估计参数估计卫生统计学教研室 张彦琦可反映某一因素两个不同水平(可反映某一因素两个不同水平( c1, c0) 的优势比的优势比 。优势比估计优势比估计logistic回归模型的参数估计回归模型的参数估计 卫生统计学教研室 张彦琦logistic回归模型的假设检验回归模型的假设检验2.1.似然比检验似然比检验 : -2lnL近似服从近似服从 分布分布G = 2(lnL1-lnL0)= 2ln( L1/L0) = p-l卫生统计学教研室 张彦琦标准化回归系数标准化回归系数标准化回归系数绝对值越大标准化回归系数绝对值越大 ,说明相应变量说明相应变量的作用越大的作用越大 .卫生统计学教研室 张彦琦实例分析实例分析卫生统计学教研室 张彦琦v数据准备成数据准备成 3列:例数、吸烟史(列:例数、吸烟史( 1:有,:有, 0:无:无),膀胱癌(),膀胱癌( 1:有,:有, 0:无):无)实例分析实例分析卫生统计学教研室 张彦琦vData Weight cases实例分析实例分析卫生统计学教研室 张彦琦vAnalyze Regression Binary Logistic实例分析实例分析卫生统计学教研室 张彦琦n

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 研究报告 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号