生存时间资料的非参数分析方法

上传人:tia****nde 文档编号:67709994 上传时间:2019-01-08 格式:PPT 页数:64 大小:846.51KB
返回 下载 相关 举报
生存时间资料的非参数分析方法_第1页
第1页 / 共64页
生存时间资料的非参数分析方法_第2页
第2页 / 共64页
生存时间资料的非参数分析方法_第3页
第3页 / 共64页
生存时间资料的非参数分析方法_第4页
第4页 / 共64页
生存时间资料的非参数分析方法_第5页
第5页 / 共64页
点击查看更多>>
资源描述

《生存时间资料的非参数分析方法》由会员分享,可在线阅读,更多相关《生存时间资料的非参数分析方法(64页珍藏版)》请在金锄头文库上搜索。

1、第十二章 生存时间资料的 非参数分析方法,5 December 2005,宇传华(http:/),目 录,第一节 生存时间资料的特点 第二节 小样本生存率的kaplan-Meier估计 第三节 大样本生存率的寿命表法估计 第四节 生存曲线比较的假设检验,第一节 生存时间资料的特点 一、数据结构 二、统计描述指标 三、资料要求,一、数据结构,在临床医学中, 对病人疗效考查: 治疗结局? 生存时间?,“ 生存时间”的概念 开始事件 终点事件 生物生存 死亡,生存时间,电脑开始使用正常 出现故障,疾病产生 治愈,疾病治愈 复发,阴性 阳性,生存时间的三个要点,一、起始事件 二、 终点事件 三、生存时

2、间,医学例子:起始事件 随访时间 终点事件,疾病确诊 死亡,治疗开始 死亡,治疗开始 痊愈,接触危险物 出现反应,治愈出院 复发,广义的“生存时间”也可为医疗费用(元)、 医疗设备使用次数、车辆行驶总里程(公里)等,随访(follow-up)资料的记录,生存资料一般通过随访收集, 记录的项目: (起始与终止)随访事件 生存时间(开始观察日期与终止观察日期)(年、月、天、小时、分、秒等) 分组变量(处理方法) 和其它协变量(性别、年龄、职业、文化程度等),01,167,生存时间资料的特点,2个效应变量(1)生存时间(天数),(2)结局(死亡与否、是否阳性等) 截尾数据:如表12-1中的1号和 3

3、号病人未观察到底,不知他们究竟能活多长时间。 产生结尾原因: (1)迁移 (2)死于其他原因 (3)因其他客观原因中途退出 (4)预定终止结果迟迟不发生 分布类型复杂:生存时间分布常呈正偏态分布,2个效应变量(1)生存时间(天数),(2)结局(死亡与否、是否阳性等) 错误1:忽略生存时间,采用Logistic回归分析死亡率 错误2:忽略结局,采用t检验、线性回归分析生存时间,What is Censoring?(截尾问题),X indicates event 0 indicates loss to follow-up,得不到确切的生存时间,但它们提供的生存时间长于观察期的时间,这种数据为不完全

4、数据。或截尾数据、删失数据或终检值。 (如有确切的生存时间,则这种数据称为完全数据。) 两种错误的做法: 错误1:丢弃截尾数据,只考虑确切数据。(损失了信息) 错误2:将截尾数据当作确切数据处理。(低估了生存时间的平均水平)。,截尾(删失)数据或终检值(censored data),两种错误的做法: 错误1:采用平均生存时间而不是采用中位生存时间来表示生存时间的平均水平。 错误2:采用常规t检验或方差分析进行组间比较。(应采用log-rank检验比较几组生存时间 ),正偏态(positive skewness)数据,二、生存分析的统计描述指标,1.死亡概率、生存概率 2. 生存率及其标准误 3

5、. 半数生存期(中位数) 及四分位数间距,例1 手术治疗60例肺癌病人,术后每年死亡10例,无删失。试求基本生存分析指标。N=60 注意:死亡率与死亡概率的分子相同,但分母不同; 生存概率与生存率的分子相同,但分母不同,1 . 死亡率、死亡概率、生存概率 (1) 死亡率 (mortality rate,death rate) 表示某单位时间内的死亡强度。 年平均人口数=(年初人口数+年末人 口数),(2) 死亡概率 ( mortality probability ) 指死于某时段内的可能性大小。 d/n0 年内有删失,分母用校正人口数: 校正人口数= 年初人口数删失例数 / 2 n0c/2,(

6、3) 生存概率 ( survival probability ) 指某单位时段开始时存活的个体到该时段结束时仍存活的可能性的大小。 (n0-d)/n0 分子为年末尚存人数, 若年内有删失,分母用校正人口数。,生存率 (survival rate) ( 累积生存概率 cumulative probability of survival ) 指病人经历t个单位时间后仍存活的概率。 生存概率指单个时段的概率, 生存率指从0t多个时段的积累概率。,2. 生存率及其标准误,公式1 用于完全数据 (n0-d)/N 公式2 用于 删失数据以及完全数据 S ( t ) = P (T tk ) = p1 p2

7、pk,例如 手术治疗50例肺癌病人,术后1,2,3年的 死亡数分别为10,10,10例,无截尾数据。 试求各年的 生存概率和3年生存率。 解: 各年生存概率 p1 = ( 50 10 ) / 50, p2 = ( 40 10 ) / 40, p3 = ( 30 10 ) / 30 3 年生存率 S(3) = P(T 3) (n0-d)/N = ( 50 30 ) / 50 = 0.0004 或 S(3) = p1 p2 p3 = 0.4000,生存率的标准误 生存率置信区间,生存曲线 以生存时间为横轴,生存率为纵轴绘制的曲线,(a)研究终止在475天 (b) 研究终止在474天 图12-3 乘

8、积极限法生存曲线(阶梯形)及其半数生存期(Md=158天),图12-4 寿命表法生存曲线(折线)及其半数生存期(Md=1.7年),生存曲线给我们的信息,阶梯状;每一级阶梯代表一个死亡时间点 (在截尾时间点无阶梯);如果最大时间点是截尾则生存曲线不与曲线相交(见下图),否则与横轴相交。,Death,Censored,Median Survival,1.8 Years,生存曲线给我们的信息,Source: SEER 1992-2000, from Patel et al, Gynecologic Oncology. May 2005; 97(2):550-558.,56% (A-A),68% (N

9、on-H),71% (H),5-year Survival,生存曲线给我们的信息,3. 半数生存期及四分位数间距 半数生存期 也称 中位生存期(median survival time) 即生存时间中位数,表示50%的个体可存活的时间 即生存率为时对应的生存时间(集中趋势指标)。,生存期的四分位数间距, 反映离散程度大小,三、资料的基本要求,1. 死亡例数(或死亡比例)不宜太少,否则宜出现偏性; 2. 截尾原因无偏性; 3. 生存时间尽可能记录精确,生存率估计常用的两种方法: 1. 乘积极限法,即kaplan-Meier法 (小样本时) 2. 寿命表法 (大样本时),第二节 小样本生存率的ka

10、plan-Meier估计,乘积极限法又称Kaplan-Meier 法 适用于小样本资料。 基本思想:将生存时间由小到大依次排列,在每个死亡点上,计算其期初人数、死亡人数、死亡概率、生存概率和生存率。,(a)研究终止在475天 (b) 研究终止在474天 图12-3 乘积极限法生存曲线(阶梯形)及其半数生存期(Md=158天),0,0,第三节 大样本生存率的寿命表法估计 寿命表法(life-table method)的应用早于KaplanMeier法,它是KaplanMeier法的近似方法(频数表法),图12-4 寿命表法生存曲线(折线)及其半数生存期(Md=1.7年),寿命表法只估计时段右端点

11、的生存率,省略了时段内的生存率估计,第四节 生存曲线比较的假设检验 Log rank(时序) 检验(也称为Cox-Mantel检验) Breslow检验(也称Breslow广义Wilcoxon检验 ),共19例(其中大细胞肺癌10例),其中有两个42天 通过KaplanMeier方法得到: 大细胞肺癌组中位生存时间为115天,95置信区间为42186天; 鳞状细胞肺癌组为254天,95置信区间为165458,期初人数,图 Kaplan-Meier生存曲线,绘制Kaplan-Meier生存曲线的常见错误: 在图中不标记删失的数据点。,实现Kaplan Meier方法与log-rank检验 PRO

12、C LIFETEST METHOD=km PLOTS=(S); TIME time*censor(1); STRATA group; RUN;,data a; input time group censor ; cards; 11 1 0 115 1 0 60 0 0 254 0 0 32 1 1 124 1 0 102 0 0 281 0 0 42 1 0 174 1 1 165 0 0 295 0 1 42 1 0 186 1 0 189 0 1 458 0 0 71 1 0 278 1 0 200 0 0 ; PROC LIFETEST METHOD=km PLOTS=(S); TIME

13、 time*censor(1); STRATA group; RUN;,The SAS System 20:09 Friday, December 3, 2005 4 The LIFETEST Procedure Stratum 1: group = 0 Product-Limit Survival Estimates Survival Standard Number Number time Survival Failure Error Failed Left 0.000 1.0000 0 0 0 9 60.000 0.8889 0.1111 0.1048 1 8 102.000 0.7778

14、 0.2222 0.1386 2 7 165.000 0.6667 0.3333 0.1571 3 6 189.000* . . . 3 5 200.000 0.5333 0.4667 0.1733 4 4 254.000 0.4000 0.6000 0.1738 5 3 281.000 0.2667 0.7333 0.1590 6 2 295.000* . . . 6 1 458.000 0 1.0000 0 7 0 NOTE: The marked survival times are censored observations.,Summary Statistics for Time Variable time Quartile Estimates Point 95% Confidence Interval Percent Estimate Lower Upper) 75 458.000 200.000 458.000 50 254.000 165.000 458.000 25 165.000 60.000 254.000 Mean Standard Error 256.467 51.862,The SAS System 20:09 Friday, December 3, 2005 4 The LIFETEST Proced

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号