第六讲-常用多因素回归分析方法简介

上传人:w****i 文档编号:108741421 上传时间:2019-10-25 格式:PDF 页数:80 大小:711.92KB
返回 下载 相关 举报
第六讲-常用多因素回归分析方法简介_第1页
第1页 / 共80页
第六讲-常用多因素回归分析方法简介_第2页
第2页 / 共80页
第六讲-常用多因素回归分析方法简介_第3页
第3页 / 共80页
第六讲-常用多因素回归分析方法简介_第4页
第4页 / 共80页
第六讲-常用多因素回归分析方法简介_第5页
第5页 / 共80页
点击查看更多>>
资源描述

《第六讲-常用多因素回归分析方法简介》由会员分享,可在线阅读,更多相关《第六讲-常用多因素回归分析方法简介(80页珍藏版)》请在金锄头文库上搜索。

1、2013/9/4 1 常用多因素回归分析方法简介常用多因素回归分析方法简介 陈 雯 中山大学公共卫生学院 医学统计与流行病学系 常用多因素回归分析常用多因素回归分析方法方法 前情提要前情提要 简单线性回归(简单线性回归(10) 变量数:2( X :0HH 2013/9/4 49 2.4回归系数的假设检验回归系数的假设检验 似然比检验似然比检验 (likelihood ratio test) 对数似然函数值(lnL)反映模型拟合资料的好坏 大样本条件下-2lnL近似服从自由度 的 分布,p:模型的自变量个数 似然比统计量: G=-2lnL-(-2lnL) 常用多因素回归分析方法常用多因素回归分析

2、方法 - logistic回归回归 1pN 2 2013/9/4 50 2.4回归系数的假设检验回归系数的假设检验 Wald检验:检验: 常用多因素回归分析方法常用多因素回归分析方法 - logistic回归回归 22 ) ) ( ( i i i SE i : 第i个回归系数估计值 SE : 回归系数估计值的标准误 2013/9/4 51 2.4回归系数的假设检验回归系数的假设检验 记分检验记分检验 (score test) : score=S(COV) S S:列向量,对数似然函数的一阶偏导数值 S:行向量 COV是模型的方差协方差矩阵 大样本,记分统计量服从2分布 常用多因素回归分析方法常

3、用多因素回归分析方法 - logistic回归回归 2013/9/4 52 2.4回归系数的假设检验回归系数的假设检验 常用检验方法的选择常用检验方法的选择 大样本:三种方法得到的结果一致的 小样本: 似然比检验, 结果相对也比较可靠 记分检验,比较敏感 Wald检验,偏保守 常用多因素回归分析方法常用多因素回归分析方法 - logistic回归回归 2013/9/4 53 2.5回归模型的拟合优度回归模型的拟合优度 检验假设:检验假设: H0: 模型拟合观察资料 H1: 模型不拟合观察资料 常用检验方法常用检验方法 似然比检验 (likelihood ratio test) Hosmer-L

4、emeshow检验 Cox & Snell R2系数 Nagelkerke R2系数 常用多因素回归分析方法常用多因素回归分析方法 - logistic回归回归 2013/9/4 54 2.6条件条件logistic回归回归 混杂是生物医学研究中最为棘手的问题之一。 在设计阶段,采用配对(匹配)方法对可能的 混杂因素加以控制,有助于提高研究效率和可 靠性。 该类设计资料的分析:条件logistic回归 常用多因素回归分析方法常用多因素回归分析方法 - logistic回归回归 2013/9/4 55 2.6条件条件logistic回归回归 例例28.4 (1:1配对病例对照研究) 某市调查三

5、种生活因素与胃癌发病的关系, 设计时采用 配对病例对照形式,按每一个病例的性别 、年龄和居住地选取一个健康对照。调查 的三种生活因素取值见表28.7,共调查50 对病例与对照,具体资料见表28.8。 常用多因素回归分析方法常用多因素回归分析方法 - logistic回归回归 2013/9/4 56 2.6条件条件logistic回归回归 变量名 取值范围 不良饮食习惯(X1) 0,1,2,3,4 表示程度(0 表示无,4 表示很多) 喜吃卤食和盐渍食物(X2) 0,1,2,3,4 表示程度(0 表示不吃,4 表示非常喜欢吃) 精神状况(X3) 0 表示差, 1表示好 表表28.7 三种生活因素

6、的取值三种生活因素的取值 常用多因素回归分析方法常用多因素回归分析方法 - logistic回归回归 2013/9/4 57 表表28.8 50对胃癌病例与对照三种生活因素调查结果对胃癌病例与对照三种生活因素调查结果 病例 对照 病例 对照 no X1 X2 X3 X1 X2 X3 no X1 X2 X3 X1 X2 X3 1 2 4 0 3 1 0 26 2 2 0 1 1 0 2 3 2 1 0 1 0 27 2 0 1 0 2 1 3 3 0 0 2 0 1 28 1 1 1 3 0 1 4 3 0 0 2 0 1 29 2 0 1 3 0 0 5 3 0 1 0 0 0 30 3 1

7、0 0 2 1 6 2 2 0 0 1 0 31 1 0 1 0 0 0 7 3 1 0 2 1 0 32 3 2 1 1 0 1 8 3 0 0 2 0 0 33 3 0 1 2 0 1 9 2 2 0 1 0 1 34 2 0 1 0 0 1 10 1 0 0 2 0 0 35 1 2 0 2 0 1 11 3 0 0 0 1 1 36 2 0 0 2 0 1 12 3 4 0 3 2 0 37 0 1 1 1 1 0 13 1 1 1 2 0 0 38 0 0 1 3 0 0 14 2 2 1 0 2 1 39 3 0 1 0 1 0 15 2 3 0 2 0 0 40 2 0 1 3

8、0 1 16 2 4 1 0 0 1 41 2 0 0 1 0 1 17 1 1 0 0 1 1 42 3 0 1 0 0 1 18 1 3 1 0 0 1 43 2 1 1 0 0 0 19 3 4 1 2 0 0 44 2 0 1 1 0 0 20 0 2 0 0 0 0 45 1 1 1 0 0 1 21 3 2 1 3 1 0 46 0 1 1 0 0 0 22 1 0 0 2 0 1 47 2 1 0 0 0 0 23 3 0 0 2 2 0 48 2 0 1 1 1 0 24 1 1 1 0 1 1 49 1 2 1 0 0 1 25 1 2 0 2 0 0 50 2 0 1 0

9、3 1 2013/9/4 58 2.6条件条件logistic回归回归 病历对照研究中,每一对内的病例与对照可比,对 子间病例与对照无可比性 记第i对中的病例为A,对照为B Y=1表示得病,Y=0表示未得病 常用多因素回归分析方法常用多因素回归分析方法 - logistic回归回归 2013/9/4 59 2.6条件条件logistic回归回归 常用多因素回归分析方法常用多因素回归分析方法 - logistic回归回归 )(exp1 1 )( BA XX AP 一对中只有一人得病得病 病例和对照两者之一都可能得病的条件下病例得病例和对照两者之一都可能得病的条件下病例得 病的条件概率:病的条件概

10、率:条件条件logistic回归回归 同一层病例和对照的基线患病(发病)概率相同一层病例和对照的基线患病(发病)概率相 同,回归模型无常数项同,回归模型无常数项 2013/9/4 60 2.8logistic回归模型的应用回归模型的应用 筛选危险因素筛选危险因素 研究医院抢救急性心肌梗塞(AMI)患者能否成功的危险因素 校正混杂因素校正混杂因素 研究吸烟行为与性别的联系及其强度,年龄极可能是混杂 因素,也引入回归方程 预测与判别预测与判别 临床判别诊断和流行病学筛检危险人群 (条件logistic回归 模型不能用于预测 ) 常用多因素回归分析方法常用多因素回归分析方法 - logistic回归

11、回归 2013/9/4 61 2013/9/4 常用多因素回归分析方法常用多因素回归分析方法 62 Cox回归回归 2013/9/4 62 2013/9/4 常用多因素回归分析方法常用多因素回归分析方法-Cox回归回归 63 Cox回归与回归与logistic回归的区别回归的区别 因变量因变量Y: Logistic回归:分类变量(结局)回归:分类变量(结局) Cox回归:结局回归:结局 出现结局所经历的时间长短(生存时间)出现结局所经历的时间长短(生存时间) 2013/9/4 63 3.1生存分析的基本概念生存分析的基本概念 结局事件,又称失效( failure ) 生存时间(survival

12、 time),又称失效时间(failure time) 从规定的观察起点到某一给定终点事件出现的时间 完全数据(complete data) :起点至结局所经历的时间 删失数据(censored data) 由于失访、改变防治方案、研 究工作结束等情况,使得部分病人不能随访到底,称之为 删失。从起点至删失点所经历的时间,称为删失数据。 常用多因素回归分析方法常用多因素回归分析方法-Cox回归回归 2013/9/4 64 id 年龄 瘤大小 复发 手术日期 终止观察日期 生存时间 生存结局 1 62 1 0 01/10/1996 11/20/2000 59 0 2 64 1 0 03/05/19

13、96 08/12/2000 54 1 3 52 2 1 04/09/1996 12/03/1999 44 0 4 60 1 0 06/06/1996 10/27/2000 53 0 5 59 2 0 07/20/1996 06/21/1998 23 1 6 59 1 1 08/19/1996 09/10/1999 37 1 7 63 1 0 09/16/1996 10/20/2000 50 1 8 62 1 0 09/20/1996 09/18/1999 36 1 9 50 1 0 09/26/1996 03/22/1999 30 1 10 26 1 1 11/04/1996 05/25/20

14、00 43 1 30 54 3 1 03/10/2000 09/20/2000 6 1 3.1生存分析的基本概念生存分析的基本概念 常用多因素回归分析方法常用多因素回归分析方法-Cox回归回归 表表19-2 30例膀胱肿瘤患者生存资料原始记录表例膀胱肿瘤患者生存资料原始记录表 2013/9/4 65 2013/9/4 常用多因素回归分析方法常用多因素回归分析方法-Cox回归回归 66 生存率(生存率(survival rate) 观察对象经历t个单位时段后仍存活的可能性 若无删失数据: 若有删失数据,须分时段计算生存概率: pi(i=1,2,k)为各分时段的生存概率 3.1生存分析的基本概念生

15、存分析的基本概念 观察总例数 时刻仍存活的例数t tTPtS)()( kkkkk ptSppptTPtS )( )()( 121 2013/9/4 66 2013/9/4 常用多因素回归分析方法常用多因素回归分析方法-Cox回归回归 67 估计方法(非参数)估计方法(非参数) 寿命表法寿命表法 大样本或粗略的生存时间资料 Kaplan-Meier (K-M)法法 小样本或大样本且有精确生存时间的资料 3.2生存率估计生存率估计 2013/9/4 67 2013/9/4 常用多因素回归分析方法常用多因素回归分析方法-Cox回归回归 68 图图19-2 肿瘤肿瘤3.0cm组和肿瘤组和肿瘤3.0cm组组生存曲线生存曲线(K-M法)法) 中位生存期:生存率为50时对应的生存时间 中位生存期:生存率为中位生存期:生存率为50时对应的生存时间时对应的生存时间 2013/9/4 68 2013/9/4 常用多因素回归分析方法常用多因素回归分析方法-Cox回归回归 69 比较方法(充分利用生存时间,非参数)比较方法(充分利用生存时间,非参数) log-rank检验检验 检验假设 H0: ,即两条总体生存曲线相同 H1: ,即两条总体生存曲线不同 检验统计量 3.3生存曲线比较生存曲线比较 )()( 21 tStS )()( 21 tStS g gigi V

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号