《生存分析SPSS》由会员分享,可在线阅读,更多相关《生存分析SPSS(31页珍藏版)》请在金锄头文库上搜索。
1、生存分析生存分析SPSS过程过程(SPSS of Survival Analysis) 邹莉玲邹莉玲预防医学教研室预防医学教研室1. 1. 何为生存分析?何为生存分析?生存分析生存分析(survival analysis)是将是将事件的结果事件的结果(终点事件)和(终点事件)和出现结果经历的出现结果经历的时间时间结合起来分析的一种统计分析方法。结合起来分析的一种统计分析方法。2. 2. 生存分析的目的:生存分析的目的:(1)(1)描描述述生生存存过过程程:估估计计不不同同时时间间的的总总体体生生存存率率,计计算算中中位位生生存存期期,绘绘制制生生存存函函数数曲曲线线。统统计计方方法法包包括括K
2、aplan-MeierKaplan-Meier(K-MK-M)法法、寿命表法。寿命表法。(2)(2)比比较较:比比较较不不同同处处理理组组的的生生存存率率,如如比比较较不不同同疗疗法法治治疗疗脑脑瘤瘤的的生存率,以了解哪种治疗方案较优。统计方法生存率,以了解哪种治疗方案较优。统计方法log-ranklog-rank检验等。检验等。(3)(3)影影响响因因素素分分析析:研研究究某某个个或或某某些些因因素素对对生生存存率率或或生生存存时时间间的的影影响响作作用用。如如为为改改善善脑脑瘤瘤病病人人的的预预后后,应应了了解解影影响响病病人人预预后后的的主主要要因因素素,包包括括病病人人的的年年龄龄、性
3、性别别、病病程程、肿肿瘤瘤分分期期、治治疗疗方方案案等。统计方法等。统计方法coxcox比例风险回归模型等。比例风险回归模型等。(4)(4)预测:预测:建立建立coxcox回归预测模型。回归预测模型。生存分析的理论复习生存分析的理论复习生存分析生存分析( (Survival Analysis) )菜单菜单寿命表寿命表(Life Tables)过程过程Life tables 过程用于(小样本和大样本资料):1.估计某生存时间的生存率,以及中位生存时间。2.绘制各种曲线:如生存函数、风险函数曲线等。3.对某一研究因素不同水平的生存时间分布的比较。4.控制另一个因素后对研究因素不同水平的生存时间分布
4、的比较。5.对多组生存时间分布进行两两比较。(比较总体生存时间分布采用wilcoxon检验)Company Logo实例分析实例分析例1:为了比较不同手术方法治疗肾上腺肿瘤的疗效,某研究者随机将43例病人分成两组,甲组23例、乙组20例的生存时间(月)如下所示:其中有“+”者是删失数据,表示病人仍生存或失访,括号内为死亡人数。(1)计算甲、乙两法术后10月的生存率和标准误。(2)估计两组的中位生存期。(3)绘制各组生存函数曲线。(4)比较两组的总体生存时间分布有无差别。Company Logo一、建立数据文件(一、建立数据文件(data-01.sav)定义定义5个变量:个变量:生存时间变量:t
5、,值标签“生存时间(月)”生存状态变量 :status,取值“1=死亡,0=删失或存活”频数变量:freq,值标签“人数”分组变量:group,取值“1=甲组,2=乙组”生存时间序号变量(可无):i二、操作过程二、操作过程主菜单:分析主菜单:分析Analyze生存生存Survival寿命表寿命表Life tables对话框参数设置:对话框参数设置:1.时间time框:选入 “t”。2.显示时间间隔Display time intervals框:步长by前面填入最大生存时间的上限(必须包括生存时间最大值),步长by后面填入生存时间的组距。本例上限填“60”,组距填“1”。3.状态status框:
6、选入“status”,击define events 钮,在single value框填入“1”4.因子factor框:选入“group”,定义最小值“1”,最大值“2”。5.单击选项option按钮,弹出对话框: 1)寿命表,系统默认。 2)图: 生存函数 3)比较第一个因子的水平: 整体比较三、主要输出结果三、主要输出结果1.10月生存率的估计:月生存率的估计: 甲法甲法 48%,标准误,标准误 0.1 乙法乙法 30%,标准误,标准误 0.1 2.两组的中位生存期估计:两组的中位生存期估计:Company Logo3. 绘制生存曲线:绘制生存曲线:Company Logo4. 两组生存时间
7、分布的比较:两组生存时间分布的比较:Kaplan-Meier 过程过程Kaplan-Meier过程用于(尤其小样本资料):1.估计各生存时间的生存率以及中位生存时间。2.绘制各种曲线:如生存函数、风险函数曲线等。3.比较某研究因素不同水平的生存时间有无差异。4.控制某个分层因素后对研究因素不同水平的生存时间分布进行比较。5.对多组生存时间分布进行两两比较。(各总体分布比较采用Log-rank等非参数方法)Company Logo实例分析实例分析例2:(数据同例1)为了比较不同手术方法治疗肾上腺肿瘤的疗效,某研究者随机将43例病人分成两组,甲组23例、乙组20例的生存时间(月)如下所示:其中有“
8、+”者是删失数据,表示病人仍生存或失访,括号内为死亡人数。(1)计算甲、乙两法各生存时间的生存率和标准误。(2)估计两组的中位生存期。(3)绘制各组生存函数曲线。(4)比较两组的总体生存时间分布有无差别。一、建立数据文件(同前)一、建立数据文件(同前)二、操作过程二、操作过程主菜单:分析主菜单:分析Analyze生存生存SurvivalKaplan-Meier对话框参数设置:对话框参数设置:1.时间time框:选入 “t”。2.状态status框:选入“status”,击define events 钮,在single value框填入“1”。3.因子factor框:选入“group”。4.单击
9、选项option按钮,弹出对话框: 1)统计量: 生存分析表,系统默认。 均值和中位生存时间,系统默认。 2)图: 生存函数5. 单击比较因子Compare Factor按钮,弹出对话框: 1)检验统计量Test Statistics: 都用于检验时间分布是否相同。 对数秩Log-rank:各时间点的权重一样。 Breslow:按各时间点的观察例数赋权。 Tarone-Ware:按各时间点观察例数的平方根赋权。二、操作过程二、操作过程2)水平间的两两比较。水平间的两两比较。6. 单击Save按钮,弹出保存新变量Save new variables 对话框:三、主要输出结果三、主要输出结果1.生
10、存表:生存表: 略略 2.两组的中位生存期估计:两组的中位生存期估计:3. 绘制生存曲线:绘制生存曲线:Company Logo4. 两组生存时间分布的比较:两组生存时间分布的比较:Cox回回归归过程过程Cox回归过程用于: 1. 多个因素对生存时间的影响作用分析和比较 2. 生存(或死亡)风险预测实例分析实例分析o例3:为探讨某恶性肿瘤的预后,某研究者收集了63例患者的生存时间、生存结局及影响因素。影响因素包括病人年龄、性别、组织学类型、治疗方式、淋巴结转移、肿瘤浸润程度,生存时间以月计算。变量的赋值和所收集的资料分别见表17-8和表17-9。试用Cox回归模型进行分析。NoX1X2X3X4
11、X5X6tYNoX1X2X3X4X5X6tY15400110520336200010120025701000510344011101 40135800011351355010010 26144311110103036331100012005480100071375711100120064001000600384810010120074401000580392800010 3183600011291405410110120193911101700413501011 71104201001670424700010 181114201000660434910110120012421011087044
12、43010001200135111100850454811000 151145501001820464400010 411549111017604760111001200165211101740484000010 161174811100630493201001 2411854101111010504400011 19119380100010005148100101200204011101661527201010 241213800010930534200010 212219000102415463101101200236710110930555501100 12124370011090056
13、3900010 512543100101515744000101200264900010315842111001200275011111870597400011 712853111001200606101010 401293211100120061451011010803046010011200623801000 2413143101101200636200010 1613244101101200表表17-9 63名某恶性肿瘤患者的生存时间(月)及影响因素名某恶性肿瘤患者的生存时间(月)及影响因素一、建立数据文件(一、建立数据文件(data-03.sav)二、操作过程二、操作过程主菜单:分析主
14、菜单:分析Analyze生存生存SurvivalCox RegressionCox回归主对话框回归主对话框二、操作过程二、操作过程主对话框参数设置:主对话框参数设置:1.时间time框:选入 “ t ”。2.状态status框:选入“ y ”,击define events 钮,在single value框填入“1”3.协变量Covariates框:选入“x1x6”。4.方法Method框:选择自变量进入Cox模型的方法,SPSS提供以下7种方法。o1.分析例数描述三、主要输出结果三、主要输出结果o2-1.模型检验(全变量模型)结果提示:结果提示:(1)对模型总体检验有显著意义()对模型总体检验
15、有显著意义(P=0.003),即至少),即至少有有1个自变量的总体回归系数不为个自变量的总体回归系数不为0。o2-2.模型检验(逐步回归模型,Method=向前法LR,自变量进入P0.05,剔除P0.10 )(2)采用逐步回归法进行)采用逐步回归法进行Cox模型分析的结果提示:模型拟合自变量进入和模型分析的结果提示:模型拟合自变量进入和剔除的检验水准分别为剔除的检验水准分别为0.05和和0.1时,筛选后的最佳模型包含两个协变量,时,筛选后的最佳模型包含两个协变量,即即X4(治疗方式)和(治疗方式)和X5(淋巴结是否转移),该拟合模型总体检验提示(淋巴结是否转移),该拟合模型总体检验提示具有统计
16、学意义(整体卡方具有统计学意义(整体卡方=17.594,P0.10 )B :偏回归系数 ,SE:偏回归系数的标准误Wald:用于检验总体偏回归系数与0有无显著差异, v=1时,W=(B/SE)2 。Exp(B):相对危险度估计(RR值)(3)X4(治疗方式)对生存时间有影响,采用新疗法病人的死亡风险降至传(治疗方式)对生存时间有影响,采用新疗法病人的死亡风险降至传统疗法的统疗法的17.2%(RR的的95%CI为为0.0590.503)。)。(4)X5(淋巴结是否转移)对生存时间也有影响,有淋巴结转移病人的死亡(淋巴结是否转移)对生存时间也有影响,有淋巴结转移病人的死亡风险为无淋巴结转移病人的风
17、险为无淋巴结转移病人的2.538倍(倍( RR的的95%CI为为1.0626.066)。)。o4. 自/协变量的均值(选入2个变量的模型)o5. 生存曲线(选入2个变量的模型)Company Logop 练习练习1:某临床试验对20名第或第期黑色素瘤的患者进行随访研究,截至研究期结束,记录的生存资料见表1。应用SPSS软件建立数据文件,并计算100周生存率。表1 20名第或期黑色素瘤患者的治疗后生存时间(周)12.815.624.0+26.429.230.8+39.242.058.4+72.0+77.282.487.2+94.4+97.2+106.0+114.8+117.2+140.0+168.0+练习题练习题o练习练习2:某研究者随访收集了某地男性心绞痛患者2418例,其生存时间数据整理后见表2。(1)建立SPSS数据文件。(2)估计该地男性心绞痛患者的2年生存率和标准误,以及中位生存期。o练习3: 某研究者分别用免疫疗法、药物+免疫疗法治疗黑色素瘤患者,经随访得到各患者的生存时间(月)见数据文件ex-03.sav。(1)试用Kaplan-Meier过程计算其生存率和标准误。(2)对两组的生存率进行log-rank检验。(3)绘制生存曲线,计算中位生存期。