Logistic回归spss

上传人:n**** 文档编号:50510085 上传时间:2018-08-08 格式:PPT 页数:39 大小:896KB
返回 下载 相关 举报
Logistic回归spss_第1页
第1页 / 共39页
Logistic回归spss_第2页
第2页 / 共39页
Logistic回归spss_第3页
第3页 / 共39页
Logistic回归spss_第4页
第4页 / 共39页
Logistic回归spss_第5页
第5页 / 共39页
点击查看更多>>
资源描述

《Logistic回归spss》由会员分享,可在线阅读,更多相关《Logistic回归spss(39页珍藏版)》请在金锄头文库上搜索。

1、首都医科大学流行病与卫生统计学系 罗艳侠Logistic回归分类 按照反应变量类型 二分类反应变量的logistic回归 多分类有序反应变量的logistic回归 多分类无序反应变量的logistic回归 按照研究设计类型 非条件logistic回归(研究对象未经匹配) 条件logistic回归(研究对象经过匹配)(一)基本概念和原理1.应用背景Logistic回归模型是一种概率模型, 适合于病例对照研究、随访研究和横断面 研究,且结果发生的变量取值必须是二分的 或多项分类的。可用影响结果变量发生的因 素为自变量与因变量,建立回归方程。设资料中有一个因变量y、p 个自变量x1, x2,xp,对

2、每个实验对象共有n次观测结果,可将原 始资料列成表1形式。2、Logistic回归模型的数据结构 表1 Logistic回归模型的数据结构实验对象 y X1 X2 X3 . XP 1 y1 a11 a12 a13 a1p 2 y2 a21 a22 a23 a2p 3 y3 a31 a32 a33 a3p n yn an1 an2 an3 anp 表2 肺癌与危险因素的调查分析例号 是否患病 性别 吸烟 年龄 地区1 0 1 0 30 02 0 0 1 46 13 1 0 0 35 1 30 1 0 0 26 1 注:是否患病中,0代表否,1代表是。性别 中1代表男,0代表女,吸烟中1代表吸烟,

3、 0代表不吸烟。地区中,1代表农村,0代表 城市。 表3 配对资料(1:1) 对子号 病例 对照 x1 x2 x3 x1 x2 x3 1 1 3 0 1 0 1 2 0 3 1 1 3 0 3 0 1 2 0 2 0 10 2 2 2 0 0 0 注:X1蛋白质摄入量,取值:0,1,2,3 X2不良饮食习惯,取值:0,1,2,3 X3精神状况 ,取值:0,1,2 3、 Logistic回归模型l 令: y=1 发病(阳性、死亡、治愈等)l y=0 未发病(阴性、生存、未治愈等)l 将发病的概率记为P,它与自变量x1, x2,xp之间的Logistic回归模型为:经数学变换得定义Logistic

4、变换Logistic回归方程4、回归系数i的意义流行病学的常用指标优势比(odds ratio,OR)或称比数比,定义为:暴露 人群发病优势与非暴露人群发病优势 之比。即Xi的优势比为:解 释 设第i个因素的回归系数为bi,表示当有多 个自变量存在时,其它自变量固定不变的情况 下,自变量Xi每增加一个单位时,所得到的优 势比的自然对数。也就是其它自变量固定不变 的情况下,自变量Xi每增加一个单位时,影响 因变量Y发生的倍数。 当bi0时,对应的优势比(odds ratio, 记为ORi):ORi=exp(bi)1,说明该因素是危险 因素;当bi0时,对应的优势比 ORi=exp(bi)1,说明

5、该因素是保护因素。 (二) Logistic回归类型及其实例分析 1、非条件Logistic回归 当研究设计为队列研究、横 断面研究或成组病例对照研究时 ,要用非条件Logistic回归。 例 为了探讨糖尿病与血压、血脂等因素的 关系,某研究者对56例糖尿病病人和65例 对照者进行病例-对照研究,收集了性别、 年龄、学历、体重指数、家族史、吸烟、 血压、总胆固醇、甘油三酯、高密度脂蛋 白、低密度脂蛋白11个因素的资料(完整数 据见SPSS数据文件)。性别年龄学历体重指数家族史吸烟血压总胆固醇甘油三 脂hdlldl糖尿 病160221114.301.501.242.300148321114.60

6、1.321.152.300263211124.601.151.152.300168322114.151.431.073.210145212113.421.22.632.300145332114.16.96.982.650159211114.321.021.053.490168331113.801.422.86.850263221113.871.552.44.810 表2 糖尿病影响因素赋值说明因素变量名赋值说明 性别X1男=1,女=2 年龄X2 学历X3小学以下=1,小学=2,初中=3, 高中=4,大专及以上=5 体重指数X424=1, 2426=2, 26=3 家族史X5无=1,有=2吸烟X

7、6不吸=1,吸=2 血压X7正常=1,高=2 总胆固醇X8 甘油三酯X9 高密度脂蛋白 X10 低密度脂蛋白 X11 糖尿病Y对照=0,病例=1 建立数据库多因素的logistic回归1. 基本数据描述2. 因变量的编码回归模型的整体检验 Logistic回归模型的拟合优度检验 Logistic回归模型的预测准确度逐步Logistic回归分析(1)向前法(forward selection)开始方程中没有变量,自变量 由少到多一个一个引入回归方程。 按自变量对因变量的贡献(P值的大 小)由小到大依次挑选,变量入选 的条件是其P值小于规定进入方程的 P界值Enter, 缺省值 P(0.05)。(

8、2)后退法(backward selection)开始变量都在方程中,然后 按自变量因变量的贡献(P值的大 小)由大到小依次剔除,变量剔 除的条件是其P值小于规定的剔除 标准Remove, 缺省值 p(0.10)。 (3)逐步回归法 逐步引入-剔除法(stepwise selection)前进逐步引入-剔除法 是在前进法的思想下,考虑剔除变量, 因此有两个p界值Enter, Remove 。SPSS无论是条件还是非条件Logistic 回归,在多变量分析时均可以采用逐步回 归方法,实现的方法是:在 method后加选项:Enter:所有变量一次全部进入方程。Forward:逐步向前法Backw

9、ard:后退法变量移出方程所采取的检验方法:Conditional; LR; Ward(尽量不用)调试法:P从大到小取值0.5,0.1, 0.05, 一般实际用时,Enter、 Remove应多次选取调整2.条件logistic回归分析 配对设计的类型:1:1、1:m、n:m (可采用分层COX模型来拟合)。 例如:某市调查三种生活因素与胃 癌的关系,资料见表5。 表5 配对资料(1:1) 对子号 病例 对照 x1 x2 x3 x1 x2 x3 1 1 3 0 1 0 1 2 0 3 1 1 3 0 3 0 1 2 0 2 0 10 2 2 2 0 0 0 注:X1蛋白质摄入量,取值:0,1,

10、2,3 X2不良饮食习惯,取值:0,1,2,3 X3精神状况 ,取值:0,1,2配对Logistic回归SPSS操作步骤: Analyze-Survival-COX Regression- -Time框(outcome)-Status框( Status )-Define Event: Single value 1:continue-Covariates框(x1、x2、x3)- -Method = Forward Stepwise (Likelihood Ratio)-Strata框(id)- Options-at last step-ok 在本例中不良饮食习惯X2 ,取值: 0、1,2、3,b=1.727, OR=5.624,表示 不良饮食习惯,每增加一个单位时,发 病的可能性提高到5.624倍;精神状况X3 ,取值:0、1、2,b=2.284, OR=9.821, 表示精神状况不良影响发病,精神状况 每增加一个单位时,发病的可能性提高 到2.284倍。Logistic 回归的注意事项 1.变量的取值形式 在作危险性因素分析时,以定性资料的形 式出现为好。 2.样本含量要足够大 一般地:病例与对照研究应至少各有30- 50例,且变量越多例数也要增多;配对资料 样本的匹配组数应为纳入方程中自变量个数 的20倍以上。 3.软件中变量的赋值方法。谢谢!

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号