Logit变换PPT课件

上传人:m**** 文档编号:592663564 上传时间:2024-09-21 格式:PPT 页数:29 大小:108.50KB
返回 下载 相关 举报
Logit变换PPT课件_第1页
第1页 / 共29页
Logit变换PPT课件_第2页
第2页 / 共29页
Logit变换PPT课件_第3页
第3页 / 共29页
Logit变换PPT课件_第4页
第4页 / 共29页
Logit变换PPT课件_第5页
第5页 / 共29页
点击查看更多>>
资源描述

《Logit变换PPT课件》由会员分享,可在线阅读,更多相关《Logit变换PPT课件(29页珍藏版)》请在金锄头文库上搜索。

1、Logistic回归分析回归分析公共卫生学院公共卫生学院一、前言一、前言应变量为分类指标的资料应变量为分类指标的资料线性回归分析:线性回归分析: 应变量为连续计量资料应变量为连续计量资料二、二、 Logistic回归模型回归模型Logistic回归的分类回归的分类 二分类二分类 多分类多分类 条件条件Logistic回归回归 非条件非条件Logistic回归回归Logit变换变换 也称对数单位转换也称对数单位转换 logit P=流行病学概念:流行病学概念:设设P表示暴露因素表示暴露因素X时个体发病的概率,时个体发病的概率,则发病的概率则发病的概率P与未发病的概率与未发病的概率1-P 之之比为

2、优势比为优势(odds), logit P就是就是odds的对数值。的对数值。Logistic回归模型回归模型 Logistic回归的回归的logit模型模型Logistic回归模型回归模型三、参数估计三、参数估计最大似然估计法最大似然估计法 (Maximum likehood estimate)似然函数:似然函数:L=Pi 对数似然函数:数似然函数: lnL=(ln P)=ln P1+ln P2+ln Pn 非非线性迭代方法性迭代方法Newton-Raphson法法四、参数检验四、参数检验似然比检验似然比检验(likehood ratio test) 通过比较包含与不包含某一个或通过比较包含

3、与不包含某一个或几个待检验观察因素的两个模型的对几个待检验观察因素的两个模型的对数似然函数变化来进行,其统计量为数似然函数变化来进行,其统计量为G (又称(又称Deviance)。)。 G=-2(ln Lp-ln Lk) 样本量较大时,样本量较大时, G近似服从自由近似服从自由度为待检验因素个数的度为待检验因素个数的 分布。分布。比分检验比分检验(score test) 以未包含某个或几个变量的模型为基础,以未包含某个或几个变量的模型为基础,保留模型中参数的估计值,并假设新增加保留模型中参数的估计值,并假设新增加的参数为零,计算似然函数的一价偏导数的参数为零,计算似然函数的一价偏导数(又称有效

4、比分)及信息距阵,两者相乘(又称有效比分)及信息距阵,两者相乘便得比分检验的统计量便得比分检验的统计量S 。样本量较大时,样本量较大时, S近似服从自由度为待检验因素个数的近似服从自由度为待检验因素个数的 分布。分布。Wald检验检验( wald test) 即广义的即广义的t检验,统计量为检验,统计量为u u服从正态分布,即为标准正态离差。服从正态分布,即为标准正态离差。 Logistic回归系数的区间估计回归系数的区间估计 上述三种方法中,似然比检验上述三种方法中,似然比检验最可靠,比分检验一般与它相一致,最可靠,比分检验一般与它相一致,但两者均要求较大的计算量;而但两者均要求较大的计算量

5、;而Wald检验未考虑各因素间的综合检验未考虑各因素间的综合作用,在因素间有共线性时结果不作用,在因素间有共线性时结果不如其它两者可靠。如其它两者可靠。五、回归系数的意义五、回归系数的意义 单纯从数学上讲,与多元线性单纯从数学上讲,与多元线性回归分析中回归系数的解释并无不回归分析中回归系数的解释并无不同,亦即同,亦即bi表示表示xi改变一个单位时,改变一个单位时, logit P的平均变化量。的平均变化量。流行病学中的一些基本概念:流行病学中的一些基本概念:相对危险度相对危险度(relative risk): RR=P1/P2比数比数Odds=P/(1-P)比数比比数比OR=P/(1-P)/P

6、/(1-P)在患病率较小情况下,在患病率较小情况下,ORRRLogistic回归中的常数项(回归中的常数项(b0)表示,)表示,在不接触任何潜在危险保护因素条在不接触任何潜在危险保护因素条件下,效应指标发生与不发生事件的件下,效应指标发生与不发生事件的概率之比的对数值。概率之比的对数值。Logistic回归中的回归系数回归中的回归系数( bi )表示,表示,某一因素改变一个单位时,效应指标某一因素改变一个单位时,效应指标发生与不发生事件的概率之比的对数发生与不发生事件的概率之比的对数变化值,即变化值,即OR的对数值。的对数值。Logistic回归系数的意义回归系数的意义分析因素分析因素xi为二

7、分类变量时,存在(暴为二分类变量时,存在(暴露)露)xi ,不存在(未暴露),不存在(未暴露)xi ,则则Logistic回归中回归中xi的系数的系数bi就是暴露与就是暴露与非暴露优势比的对数值即非暴露优势比的对数值即OR=exp(bi)=e (bi)分析因素分析因素xi为多分类变量时,为方便起为多分类变量时,为方便起见,常用见,常用1,2,k分别表示分别表示k个不个不同的类别。进行同的类别。进行Logistic回归分析前需回归分析前需将该变量转换成将该变量转换成k-1个指示变量或哑变个指示变量或哑变量量(design/dummy variable),这样指,这样指示变量都是一个二分变量,每一

8、个指示变量都是一个二分变量,每一个指示变量均有一个估计系数,即回归系示变量均有一个估计系数,即回归系数,其解释同前。数,其解释同前。分析因素分析因素xi为等级变量时,如果每个等级的为等级变量时,如果每个等级的作用相同,可按计量资料处理:如以最小或作用相同,可按计量资料处理:如以最小或最大等级作参考组,并按等级顺序依次取为最大等级作参考组,并按等级顺序依次取为0,1,2,。此时,。此时, e(bi) 表示表示xi增加一个增加一个等级时的优势比,等级时的优势比, e(k* bi)表示表示xi增加增加k个等级个等级时的优势比。如果每个等级的作用不相同,时的优势比。如果每个等级的作用不相同,则应按多分

9、类资料处理。则应按多分类资料处理。分析因素分析因素xi为连续性变量时,为连续性变量时, e(bi)表示表示xi增加增加一个计量单位时的优势比。一个计量单位时的优势比。 多因素多因素Logistic回归分析时,回归分析时,对回归系数的解释都是指在其它对回归系数的解释都是指在其它所有自变量固定的情况下的优势所有自变量固定的情况下的优势比。存在因素间交互作用时,比。存在因素间交互作用时, Logistic回归系数的解释变得更回归系数的解释变得更为复杂,应特别小心。为复杂,应特别小心。 根据根据Wald检验,可知检验,可知Logistic回归回归系数系数bi服从服从u分布。因此其可信区间为分布。因此其

10、可信区间为进而,优势比进而,优势比e(bi)的可信区间为的可信区间为六、六、 Logistic回归分析方法回归分析方法基本思想同线性回归分析。基本思想同线性回归分析。 从所用的方法看,有强迫法、前进法、从所用的方法看,有强迫法、前进法、后退法和逐步法。在这些方法中,筛选变量后退法和逐步法。在这些方法中,筛选变量的过程与线性回归过程的完全一样。但其中的过程与线性回归过程的完全一样。但其中所用的统计量不再是线性回归分析中的所用的统计量不再是线性回归分析中的F统计统计量,而是以上介绍的参数检验方法中的三种量,而是以上介绍的参数检验方法中的三种统计量之一。统计量之一。 为计算方便,通常向前选取为计算方

11、便,通常向前选取变量用似然比或比分检验,而向变量用似然比或比分检验,而向后剔除变量常用后剔除变量常用Wald检验。检验。七、条件七、条件Logistic回归回归对配对对配对/比调查资料,应该用条件比调查资料,应该用条件Logistic回归分析。回归分析。 对于配比资料,第对于配比资料,第i个配比组个配比组可以建立一个可以建立一个Logistic回归:回归:假设自变量在各配比组中对结果变量假设自变量在各配比组中对结果变量的作用是相同的,即自变量的回归系的作用是相同的,即自变量的回归系数与配比组无关。数与配比组无关。配比设计的配比设计的Logistic回归模型回归模型其中不含常数项。其中不含常数项

12、。可以看出此回归模型与非条件可以看出此回归模型与非条件Logistic回归模型十分相似,只不过这里的参数回归模型十分相似,只不过这里的参数估计是根据条件概率得到的,因此称为估计是根据条件概率得到的,因此称为条件条件Logistic回归模型。回归模型。条件条件Logistic回归的回归系数检验与分回归的回归系数检验与分析,和非条件析,和非条件Logistic回归完全相同。回归完全相同。八、 Logistic回归的应用回归的应用危险危险/保健因素的筛选,并确定其作用保健因素的筛选,并确定其作用大小。大小。预测:预测某种情况下或者某个病例,预测:预测某种情况下或者某个病例,某特定事件发生的概率。某特定事件发生的概率。九、 Logistic回归应用实例回归应用实例十、注意事项十、注意事项应用条件应用条件 1. 各观察对象间相互独立;各观察对象间相互独立; 2. logit P与自变量呈线性关系。与自变量呈线性关系。异常值异常值计量资料间的共线性问题计量资料间的共线性问题暴露率暴露率样本量样本量谢谢!谢谢!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号