logistic 回归分析

上传人:第*** 文档编号:58906429 上传时间:2018-11-02 格式:PPT 页数:44 大小:127.50KB
返回 下载 相关 举报
logistic 回归分析_第1页
第1页 / 共44页
logistic 回归分析_第2页
第2页 / 共44页
logistic 回归分析_第3页
第3页 / 共44页
logistic 回归分析_第4页
第4页 / 共44页
logistic 回归分析_第5页
第5页 / 共44页
点击查看更多>>
资源描述

《logistic 回归分析》由会员分享,可在线阅读,更多相关《logistic 回归分析(44页珍藏版)》请在金锄头文库上搜索。

1、1,Logistic 回归分析,金水高,2,一、问题的提出,多元线形回归给我们提出了因变量为连续变量时研究它与其它因素联系的方法。但其条件为:自变量必须为连续变量。其取值范围理论上可以为整个数轴(- + )。在流行病学研究中,经常要研究另外一类变量,称为二分变量:结果只存在两个可能的变量,如治疗效果的存活或死亡,在某种暴露下的发病与不发病等。度量这类变量的一个重要指标是率。即某种结果发生的概率。率虽然也是一个连续变量,但它是在(0-1)之间变化。对于这类变量的分析,通常采取列联表的分析方法来研究危险因素是否与反应变量存在某种联系,如果存在,这种联系的到底有多大。,3,一、问题的提出(续),1.

2、流行病学研究的主要目的1)疾病的分布(确定水平)2)研究暴露与疾病(反应)之间的联系 2.联系强弱的指标1) 相对危险度:RR = p1 / p0p1: 暴露于某个危险因素下发病的概率p0: 不暴露于某个危险因素下发病的概率(对照)2)比数比:OR = P(D=1|E=1)/P(D=0|E=1) / P(D=1|E=0)/P(D=0|E=0) D=1: 患某种疾病, D=0:不患某种疾病E=1: 暴露于某个危险因素, E=0: 不暴露于某个危险因素可以简单地表述成:OR = (p1 / q1) / (p0 / q0) p1 : 暴露于某个危险因素下发病的概率q1 : 暴露于某个危险因素下不发病

3、的概率p0 : 不暴露于某个危险因素下发病的概率q0 : 不暴露于某个危险因素下不发病的概率,4,一、问题的提出(续),3)几个具体问题相对危险度与比数比的关系:它们都表示某个危险因素对于疾病的危险程度。在发生率十分小的情况下,二者是相等的的。危险因素 概念的扩展:性别,不同暴露等级等(如文化程度、经济发展水平)、生活方式(如婴幼儿母乳喂养方式)。 3.因变量为二分变量时与自变量关系的分析1)2x2列联表下的RR及OR的计算 队列研究的结果可以表述为下列形式: E D=1 D=0 Total E=1 a b a+bE=0 c d c+DTotal a+c b+d N,5,一、问题的提出(续),

4、相对危险度(RR)的估计根据相对危险度的定义:RR = a/(a+b)/c/(c+d)比数比(OR)的估计队列研究中相对危险度定义:OR = a/(a+b)/b/(a+b) / c/(c+d)/d/(c+d)= (a/b) /(c/d)= ad/(bc)但暴露可能来自几个方面,或者发现结果受到某些不可控制的因素的影响(如性别、年龄或地区等)。,6,例1.1 口服避孕药与心肌梗塞的病例对照研究,MI 非MI 合计 服OC 39(0.62) 24 63未服OC 114(0.43) 154 268 合计 153 178 331 2 = 7. 80 P0. 05 RR=1.455 OR=2.195结论

5、:MI发病与服用口服避孕药有关。,一、问题的提出(续),7,表1.2 不同年龄组的MI与非MI发病情况,MI 非MI 合计 40岁 47 (0.38) 76 123 40岁 106(0.51) 102 208 合计 153 178 331 RR( 高年龄:低年龄) = 1.334 OR(高年龄:低年龄)=1.680 2 = 5.055 p0.05,结论:MI的发病与年龄有关。,一、问题的提出(续),8,表1.3 不同年龄组内服用避孕药的比例,年龄 服OC 不服OC 合计 40 38(0.31) 85 123 40 25(0.12) 183 208 合计 63 268 331 2 = 17. 8

6、8 P0. 01 40岁以上服用OC的比例远小于40岁以下组。,一、问题的提出(续),9,一、问题的提出(续),MI发病与服用避孕药之间存在某种关系。但因为年龄与MI发病存在相关关系,而且不同年龄组人群的服药率不同,因此在服药与发病之间的关系究竟如何,尚要在对年龄的影响进行调整后才可估计。,10,一、问题的提出(续),2)Mantel-Haenszel分层分析法按年龄分层,可以得到下表: 40岁 40岁 MI 非MI 合计 MI 非MI 合计 服OC 21 17 38 18 7 25未服OC 26 59 85 88 95 183 合计 47 76 123 106 102 208 OR(1) =

7、 2.803 OR(2) = 2.776 2 (1)= 6.77 2 (2)= 5.03,11,一、问题的提出(续),可以分别计算出不同年龄组的OR,发现与总的OR有较大的差异因此可以认为年龄是服用避孕药与MI之间联系的混杂因素。因此必须考虑对年龄的影响进行调整,并计算调整后的OR值,才是合理的。 在流行病学上,可以利用Mantel-Haenszel方法来计算调整的OR。ORMH = (ai*di/ni) / (bi *ci/ni) 在本例,可以得到ORMH =2.79 ?当因变量为 二分变量时,如果存在多于两个自变量的情况,又怎么研究不同自变量对它的影响及其大小?,12,二、Logistic

8、 回归,1. Logit转换定义: Logit P = Ln p/(1-p)表1.1中,服用口服避孕药发生MI 的Logit为:Logit Poc=1 = ln(39/24) = 0.486未服用口服避孕药发生MI 的Logit为:Logit Poc=0 = ln(114/154)= - 0.301很显然,经过Logit转换后的值可以在(- + )范围内。,13,二、Logistic 回归,2. Logistic 回归方程的建立如果研究经logit转换后的新变量与其它变量的关系,就可以利用多元线形回归模型。 设:y=Logit P = Ln p/(1-p)则: y = b0 + b1 x1 +

9、 b2 x2 + + bp xp (1) 就称为多元Logistic 回归方程。,14,二、Logistic 回归(续),y = b0 + b1 x1 + b2 x2 + + bp xp (1) 由于: y=Logit P = Ln p/(1-p) (2) 也即: Ln p/(1-p) = b0 + b1 x1 + b2 x2 + + bpxp (3) (1)与(3) 是等价的。由(3),可以得到:p = exp(b0 + b1 x1 + b2 x2 + + bpxp) / 1+ exp(b0 + b1 x1 + b2 x2 + + bpxp) (4)在Logistic回归方程的上述几种表达式

10、中,(1) (3) 及(4)都是等价的。 条件:个体之间互相独立,15,二、Logistic 回归(续),3. Logistic 模型中系数的意义 以一个最简单的Logistic回归模型做为例子。使用雌激素与子宫内膜癌病例对照研究资料 使用过 未使用过 合计 病例 55 128 183 对照 19 164 183 合计 74 293 366 建立的logistic 回归方程形式为: Logit P = -0.2478 + 1.3107 x X取值:1 使用过雌激素0 未使用过雌激素,16,二、Logistic 回归(续),使用过雌激素的Logit 为: Logit P(x=1) = -0.24

11、78 + 1.3107 = 1.063 即:Ln (p1/q1) = 1.063 称为对数比数所以,使用过雌激素的比数(odds) 为:p1/q1 = exp(1.063) =2.895未使用过雌激素的Logit 为: Logit P(x=0) = -0.2478 + 0 = -0.2478 即:Ln (p0/q0) = -0.2478 所以,未使用过雌激素的比数(odds) 为:p0/q0 = (exp(-0.2478) = 0.781 使用过雌激素相对于未使用过雌激素的比数比为: OR (odds ratio) = 2.895 / 0.781 = 3.709,17,二、Logistic 回

12、归(续),假设建立了如下的logistic回归方程:Logit P = + x x 为二分变量,当暴露时 取值为1;不暴露时,取值为0。 所以暴露时, Logit(P1) = + ,比数(odds) = exp( + )所以不暴露时, Logit(P0) = , 比数(odds) = exp() 则,暴露对于不暴露的比数比(odds ratio)为:OR = exp( + ) / exp() = exp() 在上述的使用雌激素的例子里,建立的logistic回归方程为:Logit P = -0.2478 + 1.3107 x = 1.3107 使用过雌激素相对于未使用过雌激素的比数比为:OR

13、= exp(1.3107) =3.709,18,二、Logistic 回归(续),由此可见,在logistic 回归模型中,其自变量的系数与比数比有着十分密切的关系。的意义: 为了弄清 的意义,先看在一般的方程里,回归系数的意义。 假设有以下直线回归方程,y=a + bxb 代表x 变化一个单位,因变量的变化值。在多元线形回归方程里, bi表示在其它自变量都不变的条件下,自变量xi变化一个单位,导致的因变量的变化值。,19,二、Logistic 回归(续),在Logistic回归模型(Logit P = + x)中,也表示自变量变化一个单位,导致的因变量的变化值,只不过,在这里,因变量是Logit(P), 即比数的对数。 Logit(P) = Logit(P1)- Logit(P0) = Ln (p1/q1) Ln (p0/q0) = Ln(p1/q1) / (p0/q0) = Ln (OR) = ,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号