统计17章 生存分析 2010-12-8

上传人:飞****9 文档编号:132400760 上传时间:2020-05-15 格式:PPT 页数:77 大小:429KB
返回 下载 相关 举报
统计17章 生存分析 2010-12-8_第1页
第1页 / 共77页
统计17章 生存分析 2010-12-8_第2页
第2页 / 共77页
统计17章 生存分析 2010-12-8_第3页
第3页 / 共77页
统计17章 生存分析 2010-12-8_第4页
第4页 / 共77页
统计17章 生存分析 2010-12-8_第5页
第5页 / 共77页
点击查看更多>>
资源描述

《统计17章 生存分析 2010-12-8》由会员分享,可在线阅读,更多相关《统计17章 生存分析 2010-12-8(77页珍藏版)》请在金锄头文库上搜索。

1、1 第十七章生存分析SurvivalAnalysis 授课老师 曾小敏公共卫生学院卫生统计学教研室 2 结果信息和时间信息 3 4 第一节生存分析中的基本概念第二节生存率的估计与生存曲线第三节生存曲线的log rank检验第四节Cox比例风险回归模型第五节寿命表 生存分析 将事物发生的结果和随访时间两个因素结合在一起进行分析的一种统计学方法 能充分利用得到的研究信息 更加准确地评价和比较随访资料 5 第一节生存分析中的基本概念一 基本概念1 生存时间 survivaltime 2 失效事件 failureevent 与起始事件 initialevent 3 截尾值 censoredvalue

2、4 生存率与风险函数 1 生存函数 survivalfunction 又称为累积生存率 简称生存率 2 风险函数 hazardfunction 5 死亡概率与死亡密度函数 1 死亡概率 2 死亡密度函数 6 1 生存时间 生存时间 survivaltime 是任何两个有联系事件之间的时间间隔 常用符号t表示 狭义的生存时间 患某种疾病的病人从发病 死亡所经历的时间跨度广义的生存时间 从某种起始事件 终点事件所经历的时间跨度 如 戒烟 明确 事件的起点 终点 时间的测度单位 小时 日 月 年等 2 失效事件与起始事件 失效事件 failureevent 反映治疗效果特征的事件 又称为死亡事件 终

3、点事件 它是根据研究目的确定 因此在设计时必须明确规定 并在研究中严格遵守 起始事件 initialevent 反映生存时间起始特征的事件 如疾病确诊 某种疾病治疗开始 接触毒物等 设计时也需要明确规定 7 3 截尾值 指在随访过程中 由于某种原因未能观察到病人的明确结局 即终止事件 所以不知道该病人的确切生存时间 它提供的生存时间的信息是不完全的 提示 真实的生存时间只能长于观察到的时间而不会短于这个时间 产生截尾值的原因 病人失访 病人的生存期超过了研究的终止期 在动物实验中 有时事先规定观察期限或动物数 虽然有一部分动物在到达实验终止日期时尚未出现规定的终止事件 但仍停止实验 或者当达到

4、了事先规定的终止事件的动物数后实验停止 8 影响生存时间的因素 9 10 二 资料收集 一 随访内容1 确定开始随访的时间 入院时间 确诊时间 开始治疗时间等 2 随访的结局和终止随访的时间 随访的结局可能有以下几种 死亡 即处理失效 终止时间即为 死亡 时间 生存但中途失访 包括拒绝访问 失去联系或中途退出试验 其终止时间以最后一次访问时间为准 死于其他与研究疾病无关的原因 如肺癌患者死于心肌梗死 自杀或车祸等 其终止随访的时间为死亡时间 随访截止 随访研究结束时观察对象仍存活 终止随访时间为研究结束时间 3 记录影响生存时间的有关因素 如患者的年龄 病程 术前健康状况 经济 文化 职业等

5、以便分析这些因素对生存时间的影响 11 二 随访方式1 全体观察对象同时接受处理措施 观察到最后一例出现结果 或者事先规定的随访截止时间 如图17 1a 图中 表示 死亡 o 表示失访 退出研究或死于与本研究无关的其他原因 12 2 全体观察对象在不同时间接受治疗处理 完成一定数量随访病例后决定随访截止时间 或按事先规定的时间停止随访 这是临床试验最常见的形式 如图17 1b 如病人在不同时间接受心脏移植手术 有的病人可能术后20年仍然存活 而随访难以持续那么长的时间 可根据不同的研究内容 按设计时的要求观察到预定时间 如3年或5年截止随访 13 三 生存分析研究的主要内容1 描述生存过程 研

6、究生存时间的分布特点 估计生存率及平均存活时间 绘制生存曲线等 根据生存时间的长短 可以估计出各时点的生存率 并根据生存率来估计中位生存时间 同时也可根据生存曲线分析其生存特点 2 比较生存过程 通过生存率及其标准误对各样本的生存率进行比较 以探讨各总体的生存过程是否有差别 例如比较手术治疗和化学治疗乳腺癌患者的生存率 以探讨何种治疗方案效果较好 3 分析影响生存时间的因素 重点是通过生存分析模型来探讨影响生存时间的因素 通常以生存时间和结局作为应变量而将影响他们的因素作为自变量 比如年龄 性别 病理分型 治疗方式等 通过拟合生存分析模型 筛选影响生存时间的保护因素和有害因素 4 预测 14

7、三 生存分析的基本方法1 非参数法特点 不论资料是什么样的分布形式 只根据样本提供的顺序统计量对生存率进行估计常用的方法 乘积极限法 又称Kaplan Meier法 有精确生存时间的大小样本资料 和寿命表法 大样本 对于两个及多个生存率的比较 其无效假设 H0 只是假定两组或多组总体生存时间分布 生存过程 相同 而不对其具体的分布形式及参数进行推断 推断的方法 log rank检验 对远期差异敏感 Breslow检验 又称Wilcoxon检验 对近期差异敏感 2 参数法特点 假定生存时间服从于特定参数的分布 然后根据已知分布的特点对影响生存时间进行分析常用的方法 指数分布法 Weibull分布

8、法 对数正态回归分析法和对数logistic回归分析法等 参数法通过估计的参数得到生存率的估计值 对于两组及以上的样本 可根据参数估计对其进行统计推断 3 半参数法半参数法兼有参数法和非参数法的特点 主要用于分析影响生存时间和生存率的因素 属多因素分析方法 其典型方法是Cox模型分析法 15 生存分析的结果报告 一 生存率估计 报告估计方法 生存曲线 中位生存时间 二 生存曲线比较 报告生存曲线 生存曲线比较方法 检验统计量及P值 三 影响因素分析 报告变量筛选方法 检验水准a 各变量RR RR95 可信区间及P值 16 第二节生存率的估计与生存曲线一 小样本资料生存率及其标准误的计算二 大样

9、本资料的生存分析 17 一 小样本资料的分析 生存率及其标准误的计算1 计算生存率2 计算生存率的标准误3 生存曲线4 中位生存时间 18 19 20 1 生存率的计算 采用乘积极限法 product limitedmethod 该法由Kaplan Meier于1958年提出 故又称为Kaplan Meier法 它利用条件概率及概率乘法的原理来计算生存率 21 22 注意 对于具有截尾数据的条件死亡率为0 而其条件生存率必为1 其对应的生存率必然与前一个非截尾值的生存率相同 23 2 生存率的标准误的计算 24 总体生存率的可信区间的估计 不适合于曲线尾部或接近尾部总体生存率的可信区间估计 此

10、时正态性较差 所估计的可信区间的上 下限值可能小于0或大于1 此时可以计算生存率经对数变换后的值以及相应的标准误 据此来估计其可信区间 25 26 27 3 生存曲线以生存时间为横轴 生存率为纵轴绘制一条生存曲线 survivalcurve 用以描述其生存过程 并根据两条生存曲线的高低 直观的比较不同治疗方式之间的生存过程 28 例17 2假定用乙种手术方式治疗了与上例病情一致的肾上腺肿瘤病人20例 其生存时间和死亡情况为1 2 2 3 2 4 3 6 2 8 9 2 10 11 12 13 15 17 18 括号内为死亡人数 用例17 1相同的方法计算的生存率及其标准误见表17 2 29 3

11、0 根据表17 1和表17 2计算的生存率 绘制的生存曲线见图17 2 31 乘积极限法只估计生存时间上的生存率及其标准误 故其对应的生存曲线是阶梯曲线 从图中可以看出 乙种手术方式生存曲线较低 说明其生存率较低 而甲种手术方式的生存曲线较高 说明其生存率较高 这种生存曲线又称为K M Kaplan Meier 曲线 32 4 中位生存时间 mediansurvivaltime 又称为生存时间的中位数 表示刚好有50 的个体其存活期大于该时间 它是生存分析中最常用的概括性统计量 计算方法两种 1 图解法 利用生存曲线图 见图17 2 从纵轴生存率为0 5处划一条对横轴的平行线与生存率曲线相交

12、然后自交点划垂线与横轴相交 此交点即为中位生存时间 简单直观 但其结果较粗略 在例数较少时 结果的误差较大 33 根据同样的原理可以计算出不同百分位数的生存时间 试计算生存率为40 的生存时间 34 二 大样本资料的生存分析1 生存率的计算2 生存率曲线样本较大时 随访病例的生存时间常可按年 月或日进行分组 得到具有若干时间段生存数据的频数表 对于分组的生存数据可按寿命表 lifetable 法计算生存率 其基本原理是首先求出患者在治疗后各时期的生存概率 然后根据概率的乘法原理 将各时期生存概率相乘 即得到从开始观察到各个时点的生存率 并对生存率或生存分布之间的差别进行假设检验 35 例17

13、3某研究者收集了男性心绞痛患者2418例 经随访将有关资料整理后列于表17 3 其中生存时间是以年计算的 试计算其生存率及其标准误 36 37 1 生存率的计算将生存资料以经历时间的长短分成若干时间区间 死亡和截尾的例数分别列入各时间区间内 并整理成表格的形式后计算生存率 38 39 计算结果见表17 3第 9 栏 40 2 生存率曲线分别将样本不同时点 时间区间的中点 的生存率绘在方格坐标纸上 以直线相连即得到生存率曲线图 不同样本间的生存率可进行直观的分析比较 图17 3是根据表17 3中生存时间及生存率所绘制的生存率曲线 同样可以采用图解法和线性内插法计算其中位生存时间 其方法与小样本资

14、料相同 图17 3男性心绞痛病人的生存曲线 41 第三节生存曲线的log rank检验 log rank检验的基本思想 实际死亡数与期望死亡数之间的比较 它是对各组生存率作整体的比较 故应用范围较广 它适用于两组及多组生存率之间的比较 这里只介绍两组生存率之间的比较方法 非参数法 42 例17 4据用例17 1和例17 2的资料 问甲种手术方式后和乙种手术方式后病人的生存率有无差别 43 44 45 46 47 48 应用条件 log rank检验对样本的生存率进行比较时 要求各组生存曲线不能交叉 当生存曲线有交叉提示存在某种混杂因素 此时应采用分层的办法或多因素的办法来校正混杂因素 另外 当

15、假设检验推断有差别时 可以通过生存曲线 半数生存期及相对危险度等指标来评价不同的临床处理方法的效果 49 第四节Cox比例风险回归模型 主要用于研究影响生存时间和生存率的因素 协变量X 与观察结果之间的关系 特别针对临床医学随访资料具有的特殊性 生存时间的分布种类繁多且难以确定 存在截尾数据 需要考虑多个协变量的影响等 1972年英国统计学家Cox提出了比例风险回归模型 proportionalhazardregressionmodel 简称Cox模型 50 P372 例17 5为探讨某恶性肿瘤的预后 收集了63例病人的生存时间 结局及影响因素 影响因素包括病人的治疗方式 肿瘤的浸润程度 组织

16、学类型 是否有淋巴结转移及病人的性别 年龄 生存时间以月计算 变量的赋值和收集的原始资料见表17 5和表17 6 试用Cox模型进行分析 51 1 0 52 存在截尾数据 Y 1 存在多个协变量的影响 53 生存分析的主要目的 研究协变量 X 与观察结果即生存函数 P355 生存率 之间的关系 当生存率 受到协变量的影响时 传统的方法是考虑回归分析 即各协变量对的影响 但是 生存分析研究的数据中包含有截尾数据 用一般的方法难以解决上述问题 Cox模型分析 54 一 Cox模型的基本形式 Cox模型 不直接考察生存函数与协变量的关系 以风险率函数作为应变量 并假定 前提 变量间无交互作用 55 56 二 Cox模型的参数估计与假设检验 一 Cox模型的参数估计方法 采用偏似然函数 Partiallikelihoodfunction 估计 57 二 Cox模型的假设检验 有三种方法 类似于logistic回归分析的 58 59 三 参数的意义及其解释1 回归系数与相对危险度 60 61 62 针对单个变量 63 2 64 65 66 67 四 因素的初步筛选与最佳模型的建立 单因素分析 6

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 经营企划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号