11.生存分析与SAS程序

上传人:宝路 文档编号:5807606 上传时间:2017-09-08 格式:DOC 页数:21 大小:382KB
返回 下载 相关 举报
11.生存分析与SAS程序_第1页
第1页 / 共21页
11.生存分析与SAS程序_第2页
第2页 / 共21页
11.生存分析与SAS程序_第3页
第3页 / 共21页
11.生存分析与SAS程序_第4页
第4页 / 共21页
11.生存分析与SAS程序_第5页
第5页 / 共21页
点击查看更多>>
资源描述

《11.生存分析与SAS程序》由会员分享,可在线阅读,更多相关《11.生存分析与SAS程序(21页珍藏版)》请在金锄头文库上搜索。

1、第十一章 生存分析与 SAS 程序在医学研究中,考察研究因素对研究对象的效应,经典的研究设计方法只观察其所出现的结局或结果。但是在一些诸如癌症等险恶疾病和慢性病的随访研究中,只观察其结局就不够全面,还需要考察研究对象出现某种结局所经历的时间,这段时间称为生存时间(survival time) 。生存分析是用来分析生存时间资料的统计方法,是近几十年来产生且发展甚为迅速的一门应用统计的分支。到目前为止,生存分析已形成一套完整的体系,包括描述生存规律和进行组间比较的参数和非参数方法以及分析影响生存期因素的回归模型等。本章主要介绍描述生存规律的寿命表和乘积限估计法,用于组间比较的 logrank 检验

2、和作预后因素分析的 Cox 回归模型以及相应的 SAS 过程。11.1 生存分析的基本概念11.1.1 生存时间在医学研究中,对于肿瘤、心血管等慢性疾病,要考察其治疗方法优劣,疾病预后的好坏以及影响疾病预后的因素,通常采用随访研究的方法。对某一疾病作随访研究时,一般是从某一时间开始,观察到某一规定时间截止,而研究对象是始点以后陆续进入观察。随访中要规定一个事件作为随访结局,例如:病人死于研究疾病。如果病人的随访结果是规定的结局,则称为失效或死亡(Failure) ,那么病人从进入观察随访到规定的结局出现,其间所经历的这段时间称为生存时间或失效时间(Survival time, Failure

3、time, Waiting time) 。通常用 Ti 表示( i=1,2,n, n 为观察个体数) 。在随访中,由于客观条件限制,不能也不可能将全部观察对象都观察到规定的结局(Failure ) 。在观察截止时,一组观察对象除了出现规定的结局外,还有三种结果:(1)死于其他疾病;(2)由于迁移等原因失去联系(失访) ;(3)随访截止时尚未出现规定的结局。这三种结果虽原因不一,但提供的信息是一致的,这类病人不能获得确切的生存时间,而只知道其生存期比随访观察到的时间长的信息。我们将此类病例数据称为截尾(Censored)数据。其观察到的时间用 Ci 表示。在获得生存时间时要注意以下几点:1.随访

4、结局可以不是死亡。随访的结局根据研究问题的性质和目的的不同可以是死亡、复发、恢复等。但要明确时间界线。例如:肿瘤病人已作了手术切除治疗,我们随访观察他有否复发,复发就是我们规定的结局。2.确定进入随访观察的起点时间。随访研究中,无论是同时进入观察还是陆续进入观察,对所有对象都要规定某一事件作为进入观察起点事件。例如:病人确诊,治疗开始或手术时间,动物试验中染毒等,作为起点事件要有明确的时间界线。3.时间尺度。医学研究一般用日历时间作为时间尺度。但在某些医学问题研究中,可能不以日历时间作为时间尺度更能反映所研究的问题。例如:对儿童龋齿出现的随访研究中常以儿童出到第几颗牙才出现龋齿作为时间尺度。1

5、1.1.2 生存数据的特征生存数据在结构上有它自己的特点,主要表现为:1. 生存时间数据的分布与常见的统计数据分布有明显不同,常呈指数分布、Weibull 分布、对数正态分布、对数 Logistic 分布、Gamma 分布或更为复杂的分布,生物医学中的生存时间分布有时呈现不规则状态,因而难以用传统的统计方法对这类数据进行处理。2. 生存数据中往往包含有截尾数据。在随访研究中,若能观察到研究所规定的结局就能获得确切的生存时间,这类数据称为完全数据。但在实际工作中,由于时间和客观条件限制,部分患者难以观察到终点事件,以致不能获得确切的生存时间,而只能获得进入观察至失访时这段时间。在分析总结时若剔除

6、这部分对象往往导致样本有偏性,并且这部分数据仍然提供了其实际生存时间大于观察到的截尾时间的信息,应充分利用这部分资料的信息。因此,一般随访研究的样本数据中不可避免地包含有截尾数据。11.1.3 生存时间函数描述生存时间分布规律的函数主要有生存函数、死亡概率函数、概率密度函数和危险率函数。为了后文叙述方便,这里主要介绍生存函数和危险率函数。1. 生存函数在描述生存规律的数量指标中,以往常用的指标是某个特定时间的生存率(例如: 3年生存率、5 年生存率) 。这一指标的主要缺陷为不能反映整个生存规律,一个理想的指标应该是任意时间的生存率,即生存率是任意时刻 t 的函数。其意义是研究个体生存时间长于

7、t 的概率。若令 T 为生存期,s(t) 为任意时刻 t 的生存率,得s(t)=p(Tt) 0t 20。05,1 =3.84 P16 THEN GROUP=2;ELSE GROUP=1;T=ABS(T);CARDS;-2 4 -6 -6 -7.5 8.5 -9 10 -12 13 18 -19 24 26 31-43 1.5 -2 3.5 6 6.5 -6.5 11 -11 13 17;PROC LIFETEST METHOD=PL PLOT=(S);TIME T*CENSOR(1);STRATA GROUP;RUN;2. 程序说明 数据输入时截尾数据用负值表示,第一个 if 语句产生指示变量

8、 censor,其取值为 1 时为截尾数据,取值为 0 时为完全数据。第 2 个 if 语句产生分组变量 group,前 16 个数值属于用猪苓组(1 组) ,后 10 个数据属于对照组(2 组) 。对 t 取绝对值是为了保证参与计算的生存时间都是正值。PROC LIFETEST 过程可选择寿命表法或乘积限估计法对生存资料作生存率估计,并可对两组或多组间的生存率作 Logrank 检验和 Wilcoxon 检验。method=选项有两种选择,即 PL 和 life,PL 选项为隐含值,表示用乘积限估计法估计生存率,Life 表示用寿命表法估计生存率,当用寿命表法分析时,程序自动形成生存时间的分

9、组区间,也可人为指定分组区间,在 proc 语句中加上 intervals=(a to b by c), a、b、c 分别表示初值、终值和步长。Plots=( )要求绘图,其中 s 表示生存率曲线,L 表示取对数, H 表示危险率函数,图形的横纵坐标分别为:s=(t,s)、LS=(t,-log(s),LLs=(log(t),log,Log(-log(s)、H(t,h)。time语为 lifetest 过程中必须语句,为设置生存时间和截尾指示。当有分组变量时用 strate 表示。如果资料中还包含有协变量,可在 num 语句前加 test 语句,如 test X1 X2,以便检验协变量与生存时间

10、联系的密切程度。如果用下一节介绍的 phreg 过程来揭示协变量与生存时间的关系则更好。3. 输出结果及解释结果首先输出两组的乘积限法估计的生存率(survival)及死亡率(Failure),生存率的标准误(Survival Standard Error) 、死亡数(Number Failed)和存活数(Number left),表示有*号者为截尾观察值。输出中有生存时间的四分位数,第 50%位数为中位生存期,第 1 组为 24 个月,第 2 组为 11 个月,两组平均生存期分别为 20.35 和 10.76 个月,由于第 1 组最后一个值为截尾数据,所以均数的估计是有偏性的。 The LI

11、FETEST ProcedureProduct-Limit Survival EstimatesGROUP = 1SurvivalStandard Number NumberT Survival Failure Error Failed Left0.0000 1.0000 0 0 0 162.0000* . . . 0 154.0000 0.9333 0.0667 0.0644 1 146.0000* . . . 1 136.0000* . . . 1 127.5000* . . . 1 118.5000 0.8485 0.1515 0.0999 2 109.0000* . . . 2 910

12、.0000 0.7542 0.2458 0.1256 3 812.0000* . . . 3 713.0000 0.6465 0.3535 0.1468 4 618.0000 0.5387 0.4613 0.1570 5 519.0000* . . . 5 424.0000 0.4040 0.5960 0.1657 6 326.0000 0.2694 0.7306 0.1559 7 231.0000 0.1347 0.8653 0.1231 8 143.0000* . . . 8 0* Censored ObservationSummary Statistics for Time Variab

13、le T Point 95% Confidence IntervalQuantile Estimate Lower, Upper)75% 31.0000 18.0000 .50% 24.0000 13.0000 31.000025% 13.0000 8.5000 24.0000Mean 20.3549 Standard Error 2.9640NOTE: The last observation was censored so the estimate of the mean is biased.The LIFETEST ProcedureProduct-Limit Survival EstimatesGROUP = 2SurvivalStandard Number NumberT Survival Failure Error Failed Left0.0000 1.0000 0 0 0 101.5000 0.9000 0.1000 0.0949 1 92.0000* . . . 1 83.5000* . . .

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 其它中学文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号