[小学作文]生存分析的SAS编程操作

上传人:油条 文档编号:49650005 上传时间:2018-08-01 格式:PPT 页数:32 大小:141.50KB
返回 下载 相关 举报
[小学作文]生存分析的SAS编程操作_第1页
第1页 / 共32页
[小学作文]生存分析的SAS编程操作_第2页
第2页 / 共32页
[小学作文]生存分析的SAS编程操作_第3页
第3页 / 共32页
[小学作文]生存分析的SAS编程操作_第4页
第4页 / 共32页
[小学作文]生存分析的SAS编程操作_第5页
第5页 / 共32页
点击查看更多>>
资源描述

《[小学作文]生存分析的SAS编程操作》由会员分享,可在线阅读,更多相关《[小学作文]生存分析的SAS编程操作(32页珍藏版)》请在金锄头文库上搜索。

1、生存分析的SAS编程操作薛 富 波 2006/05/21生存分析的有关概念n事件时间(time-to-event,TTE):又称为生存时间 (survival time)或失效时间(failure time),是指 从研究开始到相应事件发生的时间。n删失值(censored value):是指TTE在某些观测上 其确切的取值是未知的,所能知道的仅仅是其测量值 肯定大于或小于某个特定值(即其取值的下限或上限 ),或者位于某个特定的取值范围内(取值区间)。n右侧删失:反映真实值下限的数据。n左侧删失:反映真实值上限的数据。n区间删失:反映真实值所在区间的数据。生存分析的方法分类n非参数法:乘积极限

2、法、寿命表法等;n参数法:指数分布法、威布尔分布(Weibull Distribution)法、对数正态回归分析法以及对 数logistic回归分析法等;n半参数法:Cox模型分析方法。生存分析方法的SAS过程n非参数法:lifetest过程;n参数法:lifereg过程;n半参数法:phreg过程。生存分析的非参数方法非参数法生存分析示例1n45例乳腺癌患者中,免疫过氧化物酶检测结果 显示9例阳性、36例阴性,比较其生存时间分 布的SAS程序如下。proc lifetest plots=(s);time time*censor(1);strata immuno; run;非参数法生存分析示例

3、2proc lifetest data=valung method=lt;time survtime*censor(1);strata cell; run;一项有关肺癌患者生存天数的临床研究数据。应变量survtime 表示患者生存天数,其中的负值表示删失值;协变量包括cell (细胞类型)、治疗方法therapy(标准方法和试验方法)、 既往治疗prior(0-无,10-有)、年龄age(岁)、诊断月数 diagtime(确诊至入组时的以月为单位的时间间隔)、KPS评 分kps等。数据中产生一个删失值指示变量censor(取1表示删 失,取0表示非删失),一个治疗分组变量treatment(

4、0表示 标准方法,1表示试验方法)。lifetest过程n用以对右侧删失类型的时间数据进行时间分布 的描述以及多组间时间分布的比较(检验两个 或多个样本是否来自具有同一个生存函数的总 体);n提供两种秩检验方法和一种似然比检验方法来 检验多组生存函数的同一性,两种秩检验方法 为包括广义Savage(指数得分)检验(即log- rank检验)和Wilcoxon检验。 lifetest过程可包含的语句proc lifetest ; time variable ; by variables ; freq variable ; id variables ; strata variable ; surv

5、ival options ; test variables ; run ;proc lifetest语句nproc lifetest语句为调用lifetest过程的开始,其 主要语句选项及其可执行的功能见下表。proc lifetest语句的主要选项选 项功能和用法method=设置用以计算生存函数估计值的方法。此选项可设置的值及其含义如下:“pl”(或“km”) 乘积极限法(或Kaplan-Meier法);“act”(或“life”或“lt”)寿命表法。默认设置为 “method=pl”。intervals=指定用以计算寿命表的区间端点。区间端点必须为非负数,无论指定的区间端点中有无0,寿命

6、 表的计算总是以0为第一个区间的起点,而每一个区间只具有下端点而无上端点(即为半开半闭 区间)。ninterval=指定寿命表区间的个数,此选项可被“width=”和“intervals=”所覆盖。当设置“ninterval=”选项时 ,lifetest过程将根据所设置的区间个数划分寿命表的区间,但区间端点将会作适当的调整,使其 以整数的形式出现。因此,最终划分的区间数不一定与设置的区间数完全相符。默认设置为 “ninterval=10”。width=以寿命表法计算生存函数估计值时 ,指定寿命表的区间宽度。此选项可被“intervals=”所覆盖。plots=为生存函数估计值或删失值绘制图形。

7、其完整设置形式应为“PLOTS= ( type )”,其中“type”代表绘图的类型,“NAME=name”表示将所绘图形 以指定的名称存储为SAS目录的条目(entry),其中“NAME”为关键字(可为小写),“name” 为用户指定的条目名称。关于绘图类 型详见“plots=”选项的绘图类型。nocensplot当设置了“plots=”选项时 ,禁止将删失值显示在图形中。当选择寿命表法进行计算时,无需设 置此选项。timelist=指定一系列时间点,从而在结果中针对这 些时间点显示相应的Kaplan-Meier估计值,该时间 点 在输出结果中所在的列以“_TIME_”为标识 。alphaq

8、t=指定生存时间四分位数间距可信区间的置信水平(须在0.00010.9999之间),默认设置为 “alpha=0.05”。intervals=选项的设置方法n端点值间以空格分隔,如“intervals=10 30 50 70”;n端点之间以逗号分隔,如 “intervals=10,30,50,70”;n“a to b”的形式,如“intervals=1 to 7”;n“a to b by c”的形式,如“intervals=1 to 7 by 2” ;n混合方式,如“intervals=1,3 to 7, 10”。plots=选项的绘图类型 绘图类型关键字绘图类型censored 或 c绘制各

9、层有关删失值情况的图形survival 或 s以生存分布函数估计值对时间绘图logsurv 或 ls以生存分布函数估计值的对数对时间绘图loglogs 或 lls以 对时间的对数 绘图hazard 或 h以风险函数估计值对时间绘图pdf 或 p以概率密度函数估计值对时间绘图strata语句nstrata语句的作用是指定用以分层的变量;nlifetest过程根据strata变量的非缺失值对输入数据进行分 层;n如果要将strata变量的缺失值也作为一个合法的水平用以 分层,可在strata语句中设置“missing” 选项;nstrata语句中可指定多个分层变量,分层情况将由各分层 变量水平的组

10、合来决定;n对于数值型分层变量,若为其设置分层区间端点列表,该 变量的水平与形成的区间一一对应,设置方式与proc lifetest语句的“intervals=”选项中类似 ;n对于数值型分层变量,若为其设置分层区间端点列表,该 变量的水平与形成的区间一一对应。所划分的区间均为半 开半闭区间,第一个区间总是以-为下界,最后一个区间 总是以为上界。strata语句分层区间端点列表设置方式端点值间以空格分隔,如: strata age(5 10 20 30); 端点之间以逗号分隔,如: strata age(5,10,20,30); “a to b”的形式,如: strata age(5 to 1

11、0); “a to b by c”的形式,如: strata age(5 to 30 by 10); 混合方式,如: strata age(5,10 to 50 by 10);举例: strata wt(50 to 80 by 10); 此时变量wt将按照如下的5个区间划分成5个水平 :test语句ntest语句指定需要与生存时间进行关联性分析 的协变量;ntest语句中的变量必须为数值型;n对于test变量,lifetest过程将通过两类秩检验 统计量来检验它们与生存时间的关联性;n每一个test变量的单变量检验的统计量也将被 给出;n一个有关协变量联合效应的统计量列表也将被 给出,此统计量

12、列表的顺序和各协变量对联合 效应贡献的大小顺序相一致。time语句ntime语句为调用lifetest过程所必需,用以指定代表生 存时间的变量。ntime语句具有如下的形式:time variable ;n其中“variable”即为生存时间变量的名称,此变量名称 必须指定;n随后的星号“*”及“censor(list)”项可有可无,用来表示 数据的删失值情况。“censor”为代表删失值状况的变 量名称,“(list)”为该变量的部分取值列表(须为数 值型,且不是缺失值),如果此变量取该列表中的值 ,则该观测上的生存时间为删失值;n此处的删失值均表示右侧删失值。生存分析的半参数方法半参数法生

13、存分析示例1proc phreg data=Myeloma;model Time*VStatus(0)=LogBUN HGB Platelet Age LogWBC Frac LogPBM Protein SCalc/ selection=stepwise slentry=0.15 slstay=0.15 details; run;一项有关骨髓瘤患者生存时间的研究数据,治疗了65例患者,研究中48 名患者死亡,17名存活。变量time表示患者从确诊之日起的生存时间; 变量vstatus表示患者的生存状态,0代表存活,1代表死亡。怀疑与生存 函数有关的变量包括logbun(确诊时BUN对数值),

14、hgb(确诊时HGB ),platelet(血小板,0-异常,1-正常),age(年龄),logwbc(确 诊时白细胞对数值),frac(确诊时骨折发生,0-无,1-有),scalc( 确诊时血清钙含量)。分析目的在于从该9个解释变量中鉴别出重要的 预后因素。phreg过程nphreg过程针对生存数据执行基于Cox比例风 险模型(Cox proportional hazards model)的 回归分析;n可以检验有关回归参数的线性假设;n针对配对病例-对照研究执行条件logistic回归 分析过程;n创建包含有关统计量的输出数据集等。phreg过程可包含的语句proc phreg ; mod

15、el response = variables ; strata variable ; test equation1 ; freq variable ; weight variable ; id variables ; output ; baseline ; by variables ; run ;proc phreg语句nproc phreg语句为调用phreg过程的开始,语 句中可设置的语句选项较少,其设置方法及功 能详见下表。proc phreg语句选项选 项功能和用法covout要求将各参数估计值的协方差矩阵输出到“outest=”选项所指定的输出数据集中 。此选项须 在设置了“out

16、est=”选项的情况下方有效。covsandwich 要求给出协方差矩阵的lin-wei稳健三明治估计值(robust sandwich estimate)。 设置此选项时 ,上述方法还将被用于总体假设的wald检验,各参数的假设检验 以及与test语句有关的假设检验 。该选项 中“(aggregate)”为可选项,如果设置此 项,则在协方差矩阵的计算中要求将每一id标识(须存在id语句以指定id变量) 的得分残差进行合计。 data=指定要进行分析的输入数据集名称。multipass对于每一步newton-raphson迭代,要求phreg过程对“(start,stop)”(区间型)型应 变量的生存时间风险 集(risk set)进行重新编排,并重新计算其中时间依赖型 变量(由programming语句所指定)的值。此选项的作用在于以增加计算时间为 代价而减少程序运行对磁盘空

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号