医学统计学--生存分析课件

上传人:我*** 文档编号:141495610 上传时间:2020-08-09 格式:PPT 页数:60 大小:438.50KB
返回 下载 相关 举报
医学统计学--生存分析课件_第1页
第1页 / 共60页
医学统计学--生存分析课件_第2页
第2页 / 共60页
医学统计学--生存分析课件_第3页
第3页 / 共60页
医学统计学--生存分析课件_第4页
第4页 / 共60页
医学统计学--生存分析课件_第5页
第5页 / 共60页
点击查看更多>>
资源描述

《医学统计学--生存分析课件》由会员分享,可在线阅读,更多相关《医学统计学--生存分析课件(60页珍藏版)》请在金锄头文库上搜索。

1、随访资料生存分析,Survival Analysis,生存分析的意义与应用,无论观察性研究,还是实验(试验)性研究,有时需对研究对象进行追踪观察,不仅了解某事件发生的结局,同时还了解发生这种结局所经历的时间。 例如临床治疗措施效果评价:白血病化疗缓解持续时间和缓解率、乳腺癌术后生存时间和生存率、肾移植术后生存时间和生存率等。,上述生存资料若按通常的方法进行分析,有两方面的问题:,1n年生存率有时出现后一年大于前一年的现象。,表1 某地19741981年胃癌根治术后随访记录,1974年1981年共手术243例,1974年手术29例,术后1年内死亡1例,活满1年的28例,到1982年末,活满8年的

2、17例。以次类推。,观察满1年的243例,活满1年的213例:,1年生存率=,观察满2年的病例243 - 46 = 197例,活满2年的共154例:,2年生存率=,6年生存率=58.23%,7年生存率=60.00%,8年生存率=58.62%,由于失访或死于其它疾病而终止观察等原因,分析时,当作存活或本病死亡均不合理,当作未观察病例则损失信息。因此,在观察例数较少同时截尾数据较多时,此法很不理想。,2. 某时点生存率不能反映整个生存过程,比较时可能出现不正确的结论。,分析生存资料的统计方法称为生存分析 (survival analysis)。它是将事件的结局和发生 这种结局所经历的时间两个因素综

3、合起来分析 的一种统计方法。它能够处理截尾数据, 并对整个生存过程进行分析或比较。,生存分析在临床和公共卫生应用广泛:,1临床治疗方案或处理措施的效果评价。如恶性肿瘤手术或化疗后(转移或死亡前)生存时间、肾移植术后生存时间、心脏起搏器的保留时间、种植牙的保留时间等。,2疾病危险因素分析和疾病预后的影响因素分析。如肺癌发病危险因素分析、肾移植手术效果的影响因素分析等。,3特殊人群卫生保健措施的效果评价。如中老年糖尿病预防效果评价、青少年控制吸烟的健康教育干预试验效果评价、食管癌高发区干预措施的效果评价、不同种类宫内节育器的节育效果评价(宫内保留时间或有效避孕时间)、某疫苗接种效果评价(观察抗体滴

4、度了解免疫力持续时间或某病发病率)等。,生存分析的几个概念:,一终点事件 终点事件 (terminal event)又称失效事件(failure event)或“死亡”事件(death event) ,泛指标志某种措施失败或失效的事件,反映治疗效果特征的事件,是根据研究目的确定的。如乳腺癌术后死亡、白血病化疗后复发、肾移植术后的肾衰等,均可作为“死亡”事件。,二生存时间 生存时间(survival time)也是一个广义概念,泛指所关心的某现象的持续时间,即随访观察持续的时间,常用符号t表示。,表2 6例乳腺癌患者术后随访记录,生存时间分为两种类型:,1完全数据(complete data):

5、指从观察起点到发生“死亡”事件所经历的时间。提供了观察对象确切的生存时间。,2截尾数据(censored data):亦称截尾值(censored value)或终检值。指从观察起点到发生非“死亡”事件所经历的时间。,截尾原因大致有三种情况:,1. 失访:未继续就诊、拒绝访问或搬迁而失去联系。 2. 死于与研究疾病无关的原因:由于其他原因死亡。 3. 研究终止:研究结束时终点事件尚未发生。,截尾数据不能提供完全的信息,真实的生存时间未知,只知道比观察到的截尾时间长,常用符号“”表示。,生存资料的特点:,1. 有生存结局、生存时间,2. 有不确定数据(截尾数据),3. 分布呈指数分布、Weibu

6、ll分布、对数正态分布、对数logistic分布等,三死亡概率 死亡概率(probability of death)表示单位时间段开始存活的个体,在该段时间内死亡的可能性。符号q表示。,四生存概率 生存概率(probability of survival)表示单位时间段开始存活的个体,到该段时间结束时仍存活的可能性。符号p表示。,五生存率 生存率(survival rate, survival function)表示观察对象经历tk个单位时间段后仍存活的可能性。,。若无截尾数据,则,若有截尾数据,须分时段计算生存概率。假定观察对象在各个时段的生存事件独立,应用概率乘法定理:,pi某时段的生存概

7、率,故生存率又称累积生存概率 (cumulative probabilityof survival)。,图1 生存概率与生存率示意图,0,2,3,1,第1年生存概率,第2年生存概率,第3年生存概率,1年生存率,2年生存率,3年生存率,生存率也是一个广义概念,研究者定义的“死亡”事件不同,其含义亦不同。 白血病化疗的失败事件是白血病复发,生存率即为缓解率; 预防接种腮腺炎疫苗后,接种儿童发生腮腺炎为失败事件,此时生存率为疫苗有效率; 安放宫内节育器,失败事件定义为因节育器引起的腹痛、出血过多、感染等副作用,或带环受孕导致取出节育器,此时生存率即为节育器保留率。,六生存曲线 生存曲线(surviv

8、al curve):以生存时间为横轴,将各个时点所对应的生存率连接在一起的曲线图。,图2 生存曲线,七中位生存时间 中位生存时间(median survival time):又称半数生存期,表示恰好有50的个体尚存活的 时间。,估计方法:图解法 线性内插法,统计描述:计算生存率、绘制生存率曲线、 计算中位生存时间等。 统计推断:估计总体生存率的可信区间、 生存率曲线的比较。,生存分析主要内容:,影响因素、预测,生存分析基本方法:,1. 非参数法: 特点是不论资料是什么样的分布类型,只根据样本提供的顺序统计量对生存率进行估计,常用乘积极限法和寿命表法。,2. 参数法: 特点是假定生存时间服从于特

9、定的参数分布,根据已知分布的特点对影响生存的时间进行分析,常用指数分布法、Weibull分布法、对数正态回归分析法和对数logistic回归分析法。,3. 半参数法:介于参数法和非参数法之间,一般属多因素分析方法,用于探讨生存过程的主要影响因素,其经典方法是Cox比例风险回归模型。,随访研究的几个问题:,一、随访内容 1开始随访的时间:入(出)院时间、确诊时间、开始治疗时间等可作为随访开始的时间。如乳腺癌的乳腺切除术后第一天或出院日、白血病化疗后缓解出院日等,也可规定开始治疗日为随访开始时间。,2随访的结局和终止随访的时间 随访的结局可能有以下几种:,(2)失访:拒绝随访、失去联系或中途退出等

10、。终止随访时间为最后一次访问时间。,(1) “死亡”:泛指处理措施失败的事件。如肿瘤化疗后的复发、肾移植因肾衰或与之有关的原因而死亡等。终止随访时间为“死亡”时间。,(3) 死于与研究疾病无关的原因:终止随访时间为死亡时间。,(4) 研究终止。研究终止时观察对象仍然存活。终止随访时间为研究终止时间。,3影响生存的有关因素:如患者年龄、病情、病程、术前健康等情况,以便分析这些因素对生存率的影响。,二、随访方式 1全部观察对象同时接受处理措施,观察到最后一例出现结果或事先规定的随访截止时间。,图3 随访资料常见形式示意图,2观察对象在不同时间接受处理措施,完成 一定数量随访病例或按事先规定的时间停

11、止随访。,图4 随访资料常见形式示意图,生存率的估计与生存曲线:,一、乘积极限法 乘积极限法(product-limit estimate)又称Kaplan- Meier法,适用于未分组生存资料的分析。,例16-1 14例膀胱肿瘤3.0cm患者和16例膀胱肿瘤3.0患者的生存时间(月)如下,试估计两组各时点生存率及其标准误、各时点总体生存率的95%可信区间、中位生存时间,并绘制生存曲线。,表3 肿瘤3.0cm组生存率及标准误的计算,生存率的计算,1生存时间t:由小到大排列,遇非截尾和截尾值相同,截尾值排后。,2死亡数dt:与生存时间t对应。注意:截尾值对应的个体未发生“死亡”事件,故死亡数为0

12、。,3期初病例数nt,表示恰好在该时刻以前的病例数。如n29为10,表示恰好在29月时点前有10人存活。,4死亡概率qt,表示t月前的观察对象恰好在t月时点死亡的概率。,5生存概率pt,表示t月前的观察对象恰好在t月时点存活的概率。,6生存率S(t)。表示该人群恰好活过t 时刻的概率。它为小于和等于 t 时刻的各时点生存概率的乘积。,7生存率的标准误SES(t) 。,假定生存率近似服从正态分布,某时点总体生存率的(1a)可信区间,公式为:,总体生存率的可信区间,本例28月总体生存率的95可信区间:,即膀胱肿瘤3.0cm患者28月生存率的95%可信区间为47.7895.10%。,生存曲线尾部的生

13、存率不适合于用该法计算总体生存率的可信区间。,由表3可见,中位生存时间估计在36月。,中位生存时间,采用内插法计算:找到与生存率50相邻的上下两个生存率及 其生存时间利用线性比例关系求解中位生存时间。,若各时间点生存率均大于50,则无法估计中位生存时间。,若生存率0.5处所对应的曲线与X轴平行,则中位生存时间不止一个。,图5 肿瘤3.0cm组生存曲线,死亡时点生存率,KaplanMeier法生存曲线为阶梯形曲线。,拐点的纵坐标值在下一个台阶,曲线高度下降坡度,图6 肿瘤3.0cm组和肿瘤3.0cm生存曲线,二、寿命表法,适用于分组的生存资料。 实际工作中,随访结果常常没有每个观察对象确切的生存

14、时间,只能获得按随访时间分组的资料。 当样本较大(如n 50)时,采用乘积极限法估计生存率及其标准误较为繁琐。,例16-2 收集374名某恶性肿瘤患者随访资料,取时间区间均为1年,结果间下表,试估计生存率及其标准误,中位生存时间,并绘制生存曲线。,表4 某恶性肿瘤患者随访资料,大样本、分组(生存时间粗略)、截尾,生存率的计算,1. 确诊后年数t:“0”表示从确诊日起不满一年,“1”表示确诊后1年至不满2年,依次类推。,3期内截尾数ct:泛指具有截尾数据的人,表示随访已满t年,但在未满t+1月期间失访的人。,2期内死亡数dt :指期内死于某恶性肿瘤的人数。,4期初观察例数nt :指时刻t以前的人

15、数。,5期初有效例数nt :相当于实际观察人时数。在各年年初观察人数中减去同年截尾数的一半。,6死亡概率qt,指活满t年的病人在t1年内死亡的的概率。,7生存概率pt,指活满t年的病人在t1年内存活的概率。,8生存率S(t),表示活过t年的概率。它为小于和等于 t 时刻的各时点生存概率的乘积。,9生存率的标准误SES(t) 。,表5 寿命表法估计生存率计算表,图7 某恶性肿瘤生存曲线(寿命表法),折线形曲线,各组段对应的生存率在上限处,每组内两个时点生存率不相同,不祥其变化规律。,中位生存时间,图解法,线性内插法,(1) 样本由随机抽样方法获得,并应有足够的数量; (2) 死亡例数不能太少(30); (3) 截尾值比例不能太大; (4) 生存时间尽可能精确到天数,因为多数生存分析方法都在生存时间排序的基础上作统计处理的,即使是小小的舍入误差,也可能改变生存时间顺序而影响结果。,生存资料的基本要求:,生存曲线的比较:,例16-3 比较膀胱肿瘤3.0cm患者和16例膀胱肿瘤3.0患者的生存曲线是否有差别。,秩和检验?,log-rank检验,对数秩检验,非参数检验法,其零假设为两总体生存曲线相同,但检验过程一般不估计生存率,而利用死亡数和死亡率函数作统计推断。,基本思想:当H0成立时,根据t时点的死

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号