logistic回归首医大研究生2010

上传人:第*** 文档编号:48859174 上传时间:2018-07-21 格式:PPT 页数:64 大小:429.50KB
返回 下载 相关 举报
logistic回归首医大研究生2010_第1页
第1页 / 共64页
logistic回归首医大研究生2010_第2页
第2页 / 共64页
logistic回归首医大研究生2010_第3页
第3页 / 共64页
logistic回归首医大研究生2010_第4页
第4页 / 共64页
logistic回归首医大研究生2010_第5页
第5页 / 共64页
点击查看更多>>
资源描述

《logistic回归首医大研究生2010》由会员分享,可在线阅读,更多相关《logistic回归首医大研究生2010(64页珍藏版)》请在金锄头文库上搜索。

1、logistic回归1logistic的主要内容l非条件logistic回归l条件logistic回归l二分类logistic回归l无序多分类logistic回归l有序多分类logistic回归l1967年Truelt J,Connifield J和 Kannel W在Journal of Chronic Disease(慢性病杂志)上发表了冠 心病危险因素的研究,较早将 Logistic回归用于医学研究。概述线性回归l双变量直线回归模型y = a + b x + el多重直线回归模型y = a + b1x1 + b2x2 + + bkxk + e问题:线性回归能否解决?l在卫生服务研究中,研

2、究患者是否就诊与年 龄、性别、文化程度等的关系。l在疗效考核中,研究疗效(分显效、有效、 无效三个等级)与治疗方法、患者病情轻重 等因素的关系。 1 模型简介lP发病的概率, 0P1。lCox(1970) logit变换即?等式左边 变化范围P 发病概率 0 P1p/1-p 比数 (ratio) 0 p/1-p=2500 性别SEX1=男,0=女 出生月份MONTH/t1月12月 母亲年龄MAGE岁 父亲年龄FAGE岁 妊娠次数YC1=第1次,2=第2次, 产次CC1=第1次,2=第2次, 自然流产次数ZRLC1=第1次,2=第2次, 人工流产次数RGLC1=第1次,2=第2次, 孕前三月内母

3、亲是否吸烟MSB0=否,1=偶而,2=经常 孕后三月内母亲是否吸烟MSA0=否,1=偶而,2=经常 孕前三月内父亲是否吸烟FSB0=否,1=20支/日 孕前三月内母亲是否饮酒MDB0=节假日,1=偶而,2=经常 孕前三月内父亲是否饮酒FDB0=节假日,1=偶而,2=经常 孕后三月内母亲是否饮酒MDA0=节假日,1=偶而,2=经常 继往病史JWBS0=无,1=有 妊娠反应(呕吐)ET0=无,1=有 先兆流产XZLC0=无,1=有 贫血PX0=否,1=是 妊高症RGZ0=无,1=轻,2=中,3=重 孕期有无精神创伤JSCS0=无,1=有单因素分析结果变量名回归系数标准误P缺失数SEX0.01786

4、0.195570.927 0 MAGE-0.037360.031680.234 0 FAGE0.008220.023670.728 0 YC-0.183020.140110.191 0 CC0.105570.185750.570 1 ZRLC-0.615670.458280.179 70 RGLC-0.344720.255550.177 67 MSB163 MSA158 FSB-0.074850.085190.380 79 FSA-0.023790.083100.775 65 MDB-0.771180.994850.438 1 FDB-0.008780.135040.948 0 MDA 1 J

5、WBS135 ET0.041230.200870.837 80 XZLC0.595750.332360.073220 PX0.246180.245070.315 0 RGZ0.485250.383250.011203 JSCS205变量选不进的原因:暴露率过低新生儿体重 孕前三月内 母亲是否吸烟 孕后三月内 母亲是否吸烟 MSB=1MSB=0MSA=1MSA=0低体重 WEIGHT=1098099正常体重 WEIGHT=0102096102100母亲年龄与低体重发生率的关系MAGE母亲 年龄组 GMAGE体重2500g2500g% 200 8 322.2720 1 961555.4125 21

6、062413.7230 3 221104.3340 4 5 116.67变量选不进的原因:非线性关系母亲年龄与低体重发生率的关系年龄分组012340510152025发生率(%)不同的模型l不同的分析思维、不同的统计方法所得模型 可能不一样,应该允许多个模型并存,只要 他们真正较好地反映了病因与疾病间的联系 。 7. CHISS软件实现Logistic回归 例 某研究者调查了15名正常病人和15名肺癌 患者,记录了同肺癌发病有关的危险因素情 况, 数据如下表。试分析各因素与肺癌间的关 系。 CHISS软件实现Logistic回归 表 肺癌与危险因素的调查资 料例号 是否患病 性别 吸烟 年龄

7、地区 例号 是否患病 性别 吸烟 年龄 地区 1 1 1 0 30 0 16 0 0 0 35 1 2 1 0 1 46 1 17 0 1 0 28 0 3 1 0 1 30 1 18 0 1 1 22 1 4 1 1 1 38 0 19 0 0 0 58 1 5 1 1 1 61 0 20 0 1 0 29 0 6 1 0 1 64 1 21 0 0 0 25 0 7 1 1 1 65 1 22 0 0 0 38 0 8 1 1 1 61 1 23 0 1 0 30 1 9 1 1 1 54 0 24 0 0 1 33 0 10 1 1 1 54 1 25 0 0 0 37 1 11 1 1

8、 0 50 0 26 0 0 0 35 1 12 1 0 0 65 1 27 0 0 0 36 1 13 1 1 1 54 0 28 0 1 0 41 1 14 1 1 0 60 1 29 0 0 0 25 0 15 1 1 0 65 0 30 0 0 0 26 1 注: 是否患病中, 1代表患病,0代表无病,. 性别中 1代表男, 0代表女, 吸烟中 1代表吸烟, 0代表不吸烟. 地区中, 1代 表农村, 0代表城市。CHISS软件实现Logistic回归 在CHISS软件中建立的数据结构如下:表 数据库结构NYSEXSMOKEAGEREGION10103001610035120014611

9、71102803001301CHISS软件实现Logistic回归 CHISS的实现:点击 模型数学模型logistic模型1 进入数据模块 此数据库已建立在CHISSdata文件夹中,文 件名为:a8_1logist(非条件).DBF。打开数据库点击 数据文件打开数据库表 找到文件名为:a8_1logist(非条件).DBF 确认2 进入统计模块 进行统计计算点击 模型数学模型logistic模型解释变量: 常数项、sex、smoke、age、region反应变量: y确认 3 进入结果模块 查看结果点击 结果CHISS软件实现Logistic回归 拟合 Logistic 模型, 估计参数及

10、检验结 果(应变量=Y, 数据来自文件 :C:CHISSDataa8_1logist(非条件).DBF) 参数名 估计值 标准误 u值 p值 RR 95%CI 常数项 -9.754 4.098 2.380 0.0173 REGION -1.304 1.580 0.825 0.4093 0.27 0.0126.009 SEX 2.515 1.816 1.385 0.1661 12.37 0.352435.067 SMOKE 3.985 1.978 2.014 0.0440 53.78 1.1132597.885 AGE 0.188 0.079 2.381 0.0173 1.21 1.0341.4

11、10 结果表明,吸烟(X2)、年龄(X3)两个因素都对肺癌的发生有显著的影响, 与肺癌有关,而性别(X1)、地区(X4)两个因素都与肺癌无关。 所得的回归方程为:8 传统方法与logistic回归l四格表资料(病例对照)与logistic的关系例 四格表资料探讨妇女使用雌激素与患子宫内膜癌的病例-对照研 究 雌激素使用过 未使用过病例55(a)128(b)对照19(c)164(d)四格表资料的logistic回归lX=1 表示使用过雌激素lX=0 表示未使用过雌激素四格表资料与logistic回归lX=1时 lX=0 时传统方法与logistic回归的关系l单因素病例对照研究的OR,与logistic 回归等价;llogistic回归是传统方法的扩展。Logistic 回归的注意事项l1.变量的取值形式l 在作危险性因素分析时,以定性资料的形式 出现为好。l2.样本含量要足够大l 一般地:病例与对照研究应至少各有30-50 例,且变量越多例数也要增多;配对资料样本 的匹配组数应为纳入方程中自变量个数的20倍 以上。3.大多数情况下模型的常数项没有多大的意义 ,所以不用对常数项作解释;4.条件Logistic回归不能用于预测.

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 工程造价

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号