2016第17章-生存分析课件

上传人:F****n 文档编号:88133733 上传时间:2019-04-19 格式:PPT 页数:55 大小:640.50KB
返回 下载 相关 举报
2016第17章-生存分析课件_第1页
第1页 / 共55页
2016第17章-生存分析课件_第2页
第2页 / 共55页
2016第17章-生存分析课件_第3页
第3页 / 共55页
2016第17章-生存分析课件_第4页
第4页 / 共55页
2016第17章-生存分析课件_第5页
第5页 / 共55页
点击查看更多>>
资源描述

《2016第17章-生存分析课件》由会员分享,可在线阅读,更多相关《2016第17章-生存分析课件(55页珍藏版)》请在金锄头文库上搜索。

1、第十九章 生存分析 Survival Analysis,公共卫生与管理学院 叶晓蕾,2,一、生存分析的意义,生存分析不仅仅是字面上的“生存分析”,它代表了一种基本的分析思想。 原义: 生存分析原先是用来分析特定人群的生命过程或死亡过程的统计方法。该人群出生后,按照一定的年龄组死亡率先后死去,直到全部死亡为止,用统计学方法推算出该人群在不同年龄组的“生存概率”、“预期寿命”等指标。,3,原理及方法在其他领域的应用 利用生存分析的原理和方法,把“出生”、“死亡”的涵义稍加变通,在医学研究中可以有广泛的应用。,4,应用举例: 观察某“手术或化疗”对恶性肿瘤病人的疗效,可将“手术或化疗”代替“出生”,

2、用生存分析来分析接受该处理患者的生存时间以及活过某时点的概率。 以第一次心肌梗死代替“出生”,以第二次心肌梗死代替“死亡”,用生存分析可以预计在多少年或月内发生第二次心肌梗死的概率。,一般而言,能够明确划分起止点的现象,即凡涉及事物寿命现象的问题,均可以用生存分析的原理和方法来进行研究。,5,二、生存分析的基本概念,(一)生存分析的基本术语 (二)随访内容 (三)随访方式 (四)生存分析的主要内容,6,(一)生存分析的基本术语,1、“死亡”事件或称失败事件(failure event) 2、截尾值(censored value) 3、生存时间(survival time) 4、生存率(surv

3、ival rate),7,1、“死亡”事件或称失败事件(failure event) : 表示观察到随访对象出现了我们所规定的结局,是反映处理因素失败或失效的特征。如乳腺癌病人手术后复发、肾移植病人肾功能衰竭、白血病患者化疗后的复发等。 失败事件的认定是生存分析的基石,必须绝对准确。 注意:失效事件应当由研究目的而定,并非一定是死亡,而死亡也并非一定是失败事件。,8,2、截尾值(censored value) :删失值。 有的观察对象终止随访不是由于失败事件发生,而是由于中途失访、死于其它原因、随访截止。由于不知道这些观察对象发生失败事件的时间,他们的资料不能提供完全的信息,这些对象的观察值称

4、为截尾值,常用符号“+”表示。如140+天。,9,3、生存时间(survival time) 即随访观察持续的实足时间,按失败事件发生或失访前最后一次的随访时间记录。按天、周、月、年等时间单位记录,常用符号t表示。 一般情况下较细的时间单位准确性较高,应尽量以个体为单位采用较细的时间单位来记录。但在许多大型的随访中,不可能做到按个体记录,常见的是按固定时间段(如一月一次等)记录有多少人失访及多少人发生失败事件,此为分组生存资料。,10,如某病人1990年2月1日进入随访,1992年4月间发生失败事件,他的生存时间为t=26月; 又如某白血病患者化疗3月后失去联系,他的随访结果为一截尾值,生存时

5、间记为t=3+月; 安放心脏起搏器患者术后2年因意外事故死亡,他的随访结果也为一截尾值,生存时间记为t=2+年。 某医院对100例原发性肝癌生存情况随访结果,11,4、生存率(survival rate) 实际应当是生存概率,指某个观察对象活过t时刻的概率,常用P(Xt)表示。如P(X10)表示某对象活过10天(或10月、10年)的概率。 根据不同随访资料的失败事件,生存率可以是缓解率、有效率等。,12,(二)随访内容,1、每个观察对象有明确的开始随访时间 2、随访结局和终止随访时间 3、记录影响生存的有关因素,13,随访结局和终止随访时间,(1)“死亡”:即处理失败,终止随访时间为“死亡”时

6、间。 (2)中途失访:如失去联系、中途退出等,终止随访时间为最后一次访问时间为准。 (3)死于其它与研究疾病无关的原因,终止随访时间为死亡时间。 (4)随访截止:随访研究结束时观察对象仍存活,终止随访时间为研究结束时间。,14,记录影响生存的有关因素,如病人年龄、病程、健康状况、经济、文化、职业等因素,以便分析这些因素对生存率的影响。,15,随访资料数据的特点: (1)应变量有两个,即生存时间(天数)和结局(死亡与否)。 (2)生存时间存在观察不完全的数据。,16,(三)随访方式,1、全体观察对象同时接受处理,观察到最后一例出现结果,或者事先规定的随访截止时间。 2、全体观察对象在不同时间接受

7、处理,根据完成一定数量随访病例决定随访截止时间,或者按事先规定的时间停止随访。这种方式较为常见。,17,“”表示“死亡”; “o”表示失访退出研究或死于与本处理无关的其它原因。,18,(四)生存分析的主要内容和基本方法,1、描述生存过程 研究人群生存状态的规律,如生存时间的分布特点,计算某个时点的生存率、生存率曲线的变动趋势等。 例如根据白血病化疗后的缓解年数资料,可以估计不同年数的缓解率P(Xt),如P(X3)、P(X5)等,也可以获得这些病人的缓解率曲线。 常用方法:乘积极限法和寿命表法。,19,2、比较生存过程 两组或多组生存曲线比较。 常用方法:对数秩检验、Gehan比分检验、Bres

8、low检验。,20,3、生存过程的影响因素分析 比较不同亚人群的生存状况,进行两组或多组生存率比较,以了解哪些因素会影响目标人群的生存过程,这是生存分析方法最重要的研究内容,在临床医学中应用非常广泛。 例如分析影响乳腺癌病人手术后预后的因素,可以是病人的年龄、病程、术前健康状况、有无淋巴结转移、术后有无感染、辅助治疗措施、营养等。 Cox比例风险回归模型。,21,三、生存资料的统计描述和生存率的区间估计,(一)未分组资料的生存分析(小样本,原始数据形式) 用乘积极限法(product-limited estimates);又称Kaplan-Meier法,是一种非参数方法,主要适用于观察例数不多

9、时。,例:某种治疗方案治疗期肺癌患者11例,随访时间(月)记录如下: l,2,3,5,6,9+,11,13,16,26,37+ 试估计各时点生存率及其标准误。,22,1、生存率的计算,23,24,25,2、生存率曲线,未分组资料的生存率曲线也称KaplanMeier曲线,它是以时间t为横轴,生存率P(Xt)为纵轴,水平横线的长短代表一个t时点到下一个t时点的距离,从而表示时间与生存率关系的曲线。,26,生存率曲线阶梯曲线(Kaplan-Meier曲线),27,由图可直观地比较各样本的生存率曲线,也可对某一病例任意时刻的生存率作出估计,反之亦可由任意生存率估计生存时间。 本例中位生存时间为11个

10、月。 中位生存时间常用于比较随访资料。,28,3、总体生存率可信区间的估计,用正态近似原理估计某时点总体生存率的可信区间。,如本例6个月生存率的95%可信区间为:,29,(二)分组资料的生存分析,1、当随访资料的例数较多(如n50)时,可先将原始资料分组再进行分析。 2、很多随访研究设计的随访时间是一年或一个月一次,随访结果只有该年或该月期间的若干观察人数、发生失败事件人数和截尾人数,没有各个病例的确切观察时间,所获得的资料只能视为分组资料。,应用:,30,分组资料的生存率估计使用寿命表(life table)法,这也是一种非参数统计方法。,方法:,31,例某医院对100例原发性肝癌患者确诊后

11、进行随访,得资料见下表,根据此资料进行分组资料生存率和标准误的计算。,32,33,34,生存率曲线,与未分组资料的生存率曲线的不同之处是: 生存率的各点在各组段的上限处,用折线连接各点。,35,总体生存率可信区间的估计,用正态近似原理估计某时点总体生存率的可信区间。,如本例3个月时生存率的95%可信区间为:,36,四、两样本生存率曲线的比较,1、两时点生存率的比较 对于大样本资料,根据正态近似原理,可用u检验。 该法是正态近似法,当样本的生存率很小或很大,如小于0.05,或大于0.99,或各组死亡人数、生存人数少于5时,该方法误差较大; 由于该法只检验某时点两样本生存率的差别有无统计学意义,而

12、不能对整个生存期作出评价。,37,两样本生存曲线比较对数秩检验(log-rank test) 其基本思想是如果无效假设成立,即两总体生存曲线无差别时,则两种处理在各个时期的实际死亡数与理论死亡数不会相差太大,否则应认为无效假设不可能成立,两条生存率曲线差异有统计学意义。,四、两样本生存率曲线的比较,38,对数秩检验(log-rank test),公式:,当有 T5 时,用校正公式。,39,例 22例期非小细胞肺癌患者在不同日期经随机化分配到放疗组和放化疗联合组,从缓解出院日开始随访,随访时间(月)如下,试比较放疗和放化疗联合两种治疗方案的生存率曲线有无差别。 放疗组 1,2,3,5,6,9+,

13、11,13,16,26,37+ 放化疗联合组 10,11+ ,14,18,22,22,26,32,38,40+,42+,40,两组生存率曲线的比较,41,H0:单放疗组与放化疗组的生存率曲线分布相同 H1:单放疗组与放化疗组的生存率曲线分布不同 = 0.05 计算检验统计量:X2 = 4.65, 得 P=0.03 按 = 0.05水准,拒绝H0 ,接受H1 ,故认为单放疗组与放化疗组的生存率曲线分布不同。,42,五、生存分析的注意事项,生存资料的基本要求: 样本由随机抽样方法获得,并应有足够的数量; 截尾值比例不能太大; 生存时间尽可能精确到天数; 缺项要尽量补齐。,43,生存率比较注意事项:

14、 当比较不同治疗方案的治疗效果时,仅比较某个时点的生存率,有时可能出现不正确的结论。事实上,每一种防治措施的效果都是一条时间效应曲线,所以评价该措施的效果应对这条时间效应曲线进行全面评价,而不是仅对某个时点的生存率进行评价。 对数秩检验要求各组生存曲线不能交叉;若有交叉提示存在混杂因素,应采用分层处理或多因素分析来校正混杂作用。,44,手术疗法和化学疗法治疗乳腺癌的疗效比较,45,图8-1 两组病人生存率曲线示意,Cox风险比例回归 (Cox regression),47,一.Cox回归简介,用途:专门用于生存时间的多变量分析法。 模型结构: 设共有n例病人,第i(i=1,2,n)例病人的生存

15、时间为ti,并且有p个预后因素Xi1,Xi2,Xip。 该病人生存到时间ti时死亡风险函数(hazard function)hi(t)是基准风险函数h0(t)与预后因素函数f(jX)的乘积,而预后因素函数为: f (jX)=exp(1Xi1+2Xi2+pXip),48,Cox回归假定病人的风险函数为: hi(t)=h0(t) exp(1Xi1+2Xi2+pXip) 式中: hi(t)风险函数,又称风险率或瞬间死亡率(instantaneous failure rate) H0(t)基准风险函数,是当所有预后因素都处于0(或标准)状态下的风险函数 X观察变量 j回归系数(j=1,2,p),49,

16、对上式进行变换,可得:,由此可知,j的临床意义是: 在其它预后因素固定不变的情况下,预后因素Xj每改变一个观察单位时所引起的相对风险度改变量的自然对数值。 当j0时,Xj增加使相对风险度增加,是危险因素; 当j0时,Xj增加使相对风险度减少,是保护因素。,50,例: 某医药公司与中山医科大学协作,研究天花粉注射治疗绒癌的疗效问题。将16只体表接种绒癌成功 的裸鼠分为4组,其中一组作空白对照,其余三组分别注射天花粉、甲药和乙药,实验记录和整理数据如表,试作Cox回归分析。,SPSS过程,51,52,Cox回归变量筛选 当变量数目较多或质量较差时,在建立多因素模型之前,必须对变量作初步的筛选。 一般方法:剔去缺失数据较多,或变异程度几乎为0的变量(如X6)。,53,单变量模型方法:可用Cox回归前进法筛选变量,取变量筛选第0步的Score检验结果,作为单变量Cox回归分析结果。 其中X4的P=0.924,可将其剔除。,54,变量的危险比(risk ratio)

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号