基于非参数分析法研究某型淋巴癌患者生存时间的影响因素

上传人:aa****6 文档编号:29989086 上传时间:2018-01-26 格式:DOC 页数:15 大小:339KB
返回 下载 相关 举报
基于非参数分析法研究某型淋巴癌患者生存时间的影响因素_第1页
第1页 / 共15页
基于非参数分析法研究某型淋巴癌患者生存时间的影响因素_第2页
第2页 / 共15页
基于非参数分析法研究某型淋巴癌患者生存时间的影响因素_第3页
第3页 / 共15页
基于非参数分析法研究某型淋巴癌患者生存时间的影响因素_第4页
第4页 / 共15页
基于非参数分析法研究某型淋巴癌患者生存时间的影响因素_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《基于非参数分析法研究某型淋巴癌患者生存时间的影响因素》由会员分享,可在线阅读,更多相关《基于非参数分析法研究某型淋巴癌患者生存时间的影响因素(15页珍藏版)》请在金锄头文库上搜索。

1、各专业全套优秀毕业设计图纸基于非参数分析法研究某型淋巴癌患者生存时间的影响因素摘要探讨某淋巴肿瘤的手术治疗疗效影响因素。对两组来自某医学论坛的某淋巴肿瘤病人两年内生存时间的观察数据进行生存分析。其中,实验组 26 例,对照组 14 例。本文通过 SAS 软件来实现非参数分析法中乘积极限法拟合给定数据的生存曲线、生存率、死亡率、生存率的标准误、死亡例数和该时间点前的生存例数等数值;以及关于生存时间的描述性统计量,包括 75%,50%和 25%分位数以及相应的 95%的可信区间,还有均数和标准误,从结果可以看出平均生存时间为144.428 和 95.929 天;列出了完全数据,截尾数据的例数,以及

2、截尾数据占全部数据的百分比;以及两组的生存曲线图。用 Kaplan-Meier 法计算两组的生存率并作生存率曲线图,从两组的生存率曲线可以发现两条样本估计的生存率曲线大约在 40 天处交叉,在 40 天之前对照组的患者生存率高于实验组,而 40 天之后则实验组生存率高于对照组,并且两条生存曲线的差异是比较明显的,这两条交叉生存曲线提示对照组治疗有可能不会很快死亡,但实验组手术不太成功者很快死亡,而实验组手术成功能够存活 35 天以上的对象可能生存期会较长。log-rank 检验是一种假设检验来比较存活两个样品的分布,它是一种非参数检验。本文通过对已知实验数据进行 log-rank 检验通过对两

3、组生存曲线的比较,得知两组实验中病人的生存时间有很大差异。cox 模型用于研究各种因素(称为协变量,或伴随变量等)对于生存期长短的关系,进行多因素分析。本例中 sex 和 age 两个变量对生存时间的影响都显著。关键词:淋巴肿瘤 生存分析 log-rank 检验 cox 模型一、数据来源本文收集了 2 期的某型淋巴瘤患者的生存时间(天) 。分别是:实验组:198,165,105,36,24,64,38,69,84,109,148,176,126,96,192,159,120 +,240+,730 +,730 +,730 +,730 +,730 +,730 +,730 +,730 +,对照组:1

4、26,109,76,58,69,63,59,88,65,210 +,730 +,730 +,730 +,730 +。以及两组生存时间的影响因素:sex 及 age。其中 sex 分为 1,2 两组,男性为 1,女性为 2;age 分为两个年龄层,小于 40 岁为 1,大于等于 40 岁为 2。二、模型解释生存分析主要包括三种分析方法:非参数分析、半参数分析和参数分析。非参数方法不引入任何的外生变量,仅和确诊后存活时间有关;半参数分析方法,一部分和确诊后存活时间有关,另外一部分和某些外生变量有关,但不依赖于特定的分布假设;而参数分析方法则依赖于特定分布的假设。用 表示生存时间,即确诊后存活的时间

5、,则 的分布函数为:st st0ttsFPfud生存函数定义为生存时间大于给定时间 t 的概率,其数学表达式为: 01tsSt f式中 为生存函数或生存率,本文中指的是确诊后存活的时间大于 t 的t概率。生存函数的估计量为: 1jiist&该统计量称为K-M估计量(Kaplan-Meierestimator)。累积风险函数估计量(Nelson-Arden estimator)为: itj另外一个重要的概念是风险函数,它是指当确诊后存活的时间达到 的条st件下,在时刻 瞬间存活的概率,即:st0Pr|limhtThtt考虑一个离散的情况,设 为样本可观察的离散寿命时间。定12.ktt义 是确诊后

6、存活时间在时刻 结束的样本个数。在随访时间结束时某些个体jdjt还没有发生确诊后存活的称为审查数据。定义 是在区间 发生右审查jm1,jt的样本个数。定义 是在时刻 之前处在可能迁移风险中的样本个数,即jrjtkjiiijrdm设 是在时刻 发生迁移的瞬时概率,一个明显的估计是用确诊后存活时jjt间在时刻 结束的样本个数除以时刻 之前处在可能发生确诊后存活的样本个jt jt数,即: jjdr&在以上非参数分析方法中,迁移的风险函数只和时间有关,但是在现实生活中影响迁移的因素还有很多,因此还需要考虑其他变量对迁移的影响。可用半参数模型(也称为 Cox 比例风险模型)进行分析。cox 模型假定自变

7、量具有参数形式,而允许基准风险函数不具备特定的形式,常被用来说明变量对生存时间的影响效果。一般形式为: 0()exp()htX各参数意义:为基准风险函数,表示时点 t 的本底死亡率,是不确定的; 是时0()ht ()ht点 t 的死亡率; 为回归系数,X 为自变量向量。如 反映因素 x1 的作用,1xe使死亡率由 增加到 。 是总体回归系数的估计值,若 x1 对生存0()t0()ht1xe无影响,则理论上 =0, =1。 (假设:风险率 不随时间变化)11 ieKaplan-Meier 估计是常用来估计存活曲线的方法,其乃是用每一事件发生时间点及设限点来设定区间,较适用于一般临床相关研究。三、

8、SAS 程序1.非参数法data example1_1;input t c;if t26 then group=2; else group=1;cards;198 1 165 1 105 1 36 1 24 1 64 1 38 1 69 1 84 1 109 1 148 1 176 1 126 1 96 1 192 1 159 1 120 0 240 0 730 0 730 0 730 0 730 0 730 0 730 0 730 0 730 0 126 1 109 1 76 1 58 1 69 1 63 1 59 1 88 1 65 1 210 0 730 0 730 0 730 0 73

9、0 0 ;proc lifetest plots=(s);time t*c(0);strata group;run;2.Kaplan-Meier 估计proc lifetest plots=(s) method=pl;time t*c(0);strata group;run;3.log-rank 检验data example1_1;do c=1 to 2;input n;do i=1 to n;input time censor ;output;end;end;cards;26198 1 165 1 105 1 36 1 24 1 64 1 38 1 69 1 84 1 109 1 148 1

10、 176 1 126 1 96 1 192 1 159 1 120 0 240 0 730 0 730 0 730 0 730 0 730 0 730 0 730 0 730 0 14126 1 109 1 76 1 58 1 69 1 63 1 59 1 88 1 65 1 210 0 730 0 730 0 730 0 730 0 ;proc lifetest plots=(s);time time*censor(0);strata c;run;4.cox 模型data example1_1;do c=1 to 2;input n;do i=1 to n;input time censor

11、 sex age ;output;end;end;cards;26198 1 1 1 165 1 1 1 105 1 2 1 36 1 2 2 24 1 2 2 64 1 2 1 38 1 2 2 69 1 1 2 84 1 1 2 109 1 2 1 148 1 1 2 176 1 1 1 126 1 2 1 96 1 1 2 192 1 1 1 159 1 1 1 120 0 1 2 240 0 1 1 730 0 1 1 730 0 1 1 730 0 1 1 730 0 1 1 730 0 1 1 730 0 1 1 730 0 1 1 730 0 1 114126 1 1 1 109

12、 1 2 1 76 1 1 2 58 1 2 1 69 1 2 1 63 1 1 2 59 1 1 2 88 1 1 1 65 1 1 2 210 0 1 1 730 0 1 1 730 0 1 1 730 0 1 1 730 0 1 1;proc phreg plots=(s);model time*censor(0)=sex age;strata c;run;四、输出结果及分析1.用乘积极限法估计了生存率(Survival) ;死亡率(Failure) ,生存率的标准误(Survival Standard Error) ,死亡例数(Number Failed)和该时间点前的生存例数(Num

13、ber Left) 。其中带有*号的表示截尾。给出了关于生存时间的描述性统计量,包括 75%,50%和 25%分位数以及相应的 95%的可信区间(95% Confidence Interval) ,还有均数(Mean)和标准误(Standard Error)从结果可以看出平均生存时间为 144.428 和 95.929 天;LIFETEST 过程层 1: c = 1乘积极限生存估计值time 生存 失效 生存标准误差 失败数目剩余数目0.000 1.0000 0 0 0 2624.000 0.9615 0.0385 0.0377 1 2536.000 0.9231 0.0769 0.0523

14、2 2438.000 0.8846 0.1154 0.0627 3 2364.000 0.8462 0.1538 0.0708 4 2269.000 0.8077 0.1923 0.0773 5 2184.000 0.7692 0.2308 0.0826 6 2096.000 0.7308 0.2692 0.0870 7 19105.000 0.6923 0.3077 0.0905 8 18109.000 0.6538 0.3462 0.0933 9 17120.000 * . . . 9 16乘积极限生存估计值time 生存 失效 生存标准误差 失败数目剩余数目126.000 0.6130

15、0.3870 0.0960 10 15148.000 0.5721 0.4279 0.0979 11 14159.000 0.5312 0.4688 0.0991 12 13165.000 0.4904 0.5096 0.0995 13 12176.000 0.4495 0.5505 0.0993 14 11192.000 0.4087 0.5913 0.0983 15 10198.000 0.3678 0.6322 0.0966 16 9240.000 * . . . 16 8730.000 * . . . 16 7730.000 * . . . 16 6730.000 * . . . 16

16、 5730.000 * . . . 16 4730.000 * . . . 16 3730.000 * . . . 16 2730.000 * . . . 16 1730.000 * 0.3678 0.6322 . 16 0时间变量“time”的汇总统计量四分位数估计值95% 置信区间百分比 点 估计值 变换 下限 上限)75 . LOGLOG 192.000 .50 165.000 LOGLOG 105.000 .25 96.000 LOGLOG 36.000 148.000均值 标准误差144.428 12.183LIFETEST 过程层 2: c = 2乘积极限生存估计值time 生存 失效 生存标准误差 失败数目剩余数目0.000 1.0000 0 0 0 1458.000 0.9286 0.0714 0.0688 1 1359.000 0.8571 0.1429 0.0935 2 1263.0

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号