《生存分析之一》ppt课件

上传人:tia****nde 文档编号:70817744 上传时间:2019-01-18 格式:PPT 页数:61 大小:858.81KB
返回 下载 相关 举报
《生存分析之一》ppt课件_第1页
第1页 / 共61页
《生存分析之一》ppt课件_第2页
第2页 / 共61页
《生存分析之一》ppt课件_第3页
第3页 / 共61页
《生存分析之一》ppt课件_第4页
第4页 / 共61页
《生存分析之一》ppt课件_第5页
第5页 / 共61页
点击查看更多>>
资源描述

《《生存分析之一》ppt课件》由会员分享,可在线阅读,更多相关《《生存分析之一》ppt课件(61页珍藏版)》请在金锄头文库上搜索。

1、统计学培训班,第三讲 生存分析,生存资料统计分析 (第一讲),作者与讲授:胡良平 单位:军事医学科学院生物医学 统计咨询中心,说明,为中华耳鼻咽喉科杂志编辑委员会举办的全国培训班讲科研设计与统计分析课程; 本讲为“生存资料统计分析的第一讲”。,讲授提纲,一、生存资料的概念、特点 及描述 二、生存率的概念、合理计 算方法及描述方法 三、单因素k水平设计(k2) 生存率的比较,一、生存资料的概念、 特点及描述,1、生存资料的概念 2、生存资料的特点 3、生存资料的描述,1、生存资料的概念,什么叫生存资料?生存资料(Survival Data)或失效时间资料(Failure-time Data)与多

2、元线性回归资料很相似,只不过因变量(或反应变量)通常为观测对象生存的时间,常用来表示。,1、生存资料的概念,当然,生存时间是广义的,可以指在通常意义下生物体的生存时间、也可以指所关心的某现象(如疾病治愈后、合格品使用后)持续的时间。若生存时间是准确观测到的,则称为完全数据,否则,称为删失数据。,2、生存资料的特点,生存资料有两个明显特点:其一、所收集的资料中常常包含不完全数据,也称为截尾数据、删失数据、终检数据(Censored Data);其二、生存资料一般不服从正态分布。,2、生存资料的特点,删失数据是如何产生的?导致数据删失有多种原因,最常见的有:失访(病人因搬家、随访信件丢失、车祸等原

3、因,导致医生对他们的随访观察中断)和研究截止。由随机因素引起的,称为随机删失;若事先就定了截止日期,则称为定时删失(也称型删失);若事先就定了观察完多少例就截止研究,则称为型删失(也称为定数删失)。,2、生存资料的特点,在表达删失数据时,常在其右上角放一个“”号;而用软件分析时,常在其前放一个“”号或产生个指示变量(如:=1表示删失数据、=0表示完全数据,反过来也可以),便于计算时区别对待。为了使数据的表达与计算在形式上统一起来,本章一律用负数表示删失数据,因生存时间不可能为负值,故不会产生混淆。,2、生存资料的特点,如何处理删失数据?对于删失数据,既不能简单地弃之,又不能像对待完全数据那样给

4、予充分的信任,需要采取一些技术处理。专门处理这种资料的统计分析方法,称为生存分析(Survival Analysis)。,2、生存资料的特点,为什么生存资料一般不服从正态分布?这是由于生命现象的本质特征所决定的,一批患同一种癌症的患者,经过相同方案治疗后,少数人在很短时间内就死亡了,绝大部分患者在一段较长的时间内生存着,还有极少数患者会存活10年、20年,甚至更长时间。所以,生存资料一般呈现极严重的正偏态分布。,3、生存资料的描述,定量描述法:用“中位数”表示平均水平,用“四分位数间距”表示离散度大小。 定性描述法:用“1年生存率”、“3年生存率”、“n年生存率”等时点生存率定性地描述一组患者

5、在特定时点上的生存质量大小;用生存曲线反映整体的生存水平高低。,二、生存率的概念、合理 计算方法及描述方法,1、生存率的概念 2、生存率计算中可能 存在的问题 3、生存率的合理计算 方法,1、生存率的概念,一组患相同疾病的患者经过治疗后,在一段时间内各时点上均有可能出现死亡,各时点上的死亡概率q和生存概率p的定义分别如下:,1、生存率的概念,各时点上的死亡概率:,各时点上的生存概率: P=1-q,1、生存率的概念,然而,通常人们所说的“1年生存率”的含义是什么呢?并非指恰好在“第365天的生存概率”,而是指“在365天之内一直存活的概率”,故其计算公式如下:,公式(3),1、生存率的概念,同理

6、,可以定义“3年生存率”、“5年生存率”、“10年生存率”、“n年生存率”,如“n年生存率”定义为:,公式(4),2、生存率计算中 可能存在的问题,根据常理可知:“n年生存率”应小于“(n-1)年生存率”,然而,由上述计算“n年生存率”的定义式中不难发现,当出现下列两种情况或其中的一种情况时,可能会出现5年生存率大于3年生存率的不合理现象,即:,2、生存率计算中 可能存在的问题,第一种情况:患者在治疗或手术后3到5年间死于其他疾病; 第二种情况:患者在治疗或手术后3到5年间因迁移等原因失访。,2、生存率计算中 可能存在的问题,因为当出现上述两种情况或其中之一并用式(4)计算5年生存率时,上述两

7、种情况的患者只能排除在分母之外,即分母变小,故可能会出现5年生存率大于3年生存率的反常现象。,2、生存率计算中 可能存在的问题,另外,两组患者在某一段时间内的生存曲线并非始终平行,若仅用时点生存率的大小来比较或评价,很容易产生偏性,需要同时考察多个时点,更好的做法是直接比较两条或多条生存曲线之间的差别有无统计学意义;,2、生存率计算中 可能存在的问题,当各组的生存曲线发生交叉现象时,应查明原因,考虑是否存在混杂因素的影响,必要时需对重要非处理因素进行分层分析。,3、生存率的合理计算方法,上述可能导致“5年生存率”大于“3年生存率”的两种情况正是生存资料两个突出特点之一,即生存资料含不完全的信息

8、,需要采用专门处理生存资料的统计分析方法(即生存分析)来分析此类资料。,3、生存率的合理计算方法,在单因素生存资料的分析中,应将各时间点上的生存概率全部计算出来,自小到大连乘,一直乘到所期望的时刻为止,这种计算生存率的方法被称为“Kaplan-Meier法,简称KM法”,也叫做“乘积-极限法,即Product-Limit法,简称PL法”。,3、生存率的合理计算方法,还有一种比较合理的计算方法叫做“寿命表法”,此法需将生存时间按“区间”的形式来划分,只有在大样本时其结论才不会受到影响,因此,此法在小样本时不宜选用。,4、用PL法估计生存率 及其标准误,让t1t2tk代表离散的失效(死亡或复发等)

9、时间,设ni为第个时刻开始之前生存的个体数目,即危险集的大小(i=1,2,k),再设di是在时刻ti失效的个体数目、si=ni-di。,4、用PL法估计生存率 及其标准误,则在时刻ti的生存函数S(ti)的PL估计值是ti时刻之前各时间点上生存率的乘积,即,(5),4、用PL法估计生存率 及其标准误,式(5)中的估计量属于右连续的,即在ti时刻发生的失效事件已包括在的估计中。与它对应的标准误的估计值可用Greenwood的公式来计算:,(6),5、生存资料的描述方法 用PL法估计生存函数曲线,例1:某医生收集到15例白血病患者治疗后的生存时间(月),他们均出现了白细胞(WBC)倍增的现象。现将

10、他们的WBC数据列出(注:负值代表结尾或删失数据),试用生存分析方法中的PL法给出他们的生存曲线图。有WBC倍增组患者的WBC值:2,-2.5,3.5,4,4,-5,6,-6,7,-7,8,-9,10.5,12.5,19。,5、生存资料的描述方法 用PL法估计生存函数曲线,分析与解答:实现本题要求所需的SAS程序如下: DATA abc; INPUT lt ; censor=(lt0); t=ABS(lt); CARDS; 2 -2.5 3.5 4 4 -5 6 -6 7 -7 8 -9 10.5 12.5 19 ; PROC LIFETEST METHOD=PL PLOTS=(S,LS,LL

11、S); TIME t*censor(1); RUN;,输出的用PL法估计的Kaplan-Meier曲线,即生存曲线图:,图1 15名出现WBC倍增现象的患者生存曲线,三、单因素k水平设计(k2)生存率的比较,1、两时点生存率的比较 2、两条或多条生存曲线 的比较 3、两条或多条生存曲线 比较的实例,1、两时点生存率的比较,可分别用上述的公式(5)和公式(6)计算各时点的生存率及其标准误,代入下面的计算公式(7),该公式以正态分布为其理论依据,前提条件是:生存率不过小(如0.01)也不过大(如0.99);各组样本含量较大(最好各组n100)。,1、两时点生存率的比较,(7),解释公式(7)中各符

12、号的含义,1、两时点生存率的比较,例2:某病患者240人被完全随机地均分成A、B两组,接受不同的治疗方法,已知A组患者的1年生存率为0.8659、标准误为0.0193;B组患者的1年生存率为0.7978、标准误为0.0366,试比较两个生存率之间的差别有无统计学意义。,1、两时点生存率的比较,分析与解答:(1)判断前提条件:两样本生存率均为超过0.99,且各组样本含量n均大于100,故可以运用公式(7)进行假设检验。 (2)将已知信息代入公式(7),即:,1、两时点生存率的比较,因u=1.6461.960,即P0.05, 故可以认为两总体生存率之间 的差别无统计学意义。,2、两条或多条 生存曲

13、线的比较,两条生存曲线的比较方法较多,如:(1)Gehan比分检验法,推导出u检验统计量;(2)Cox-Mantel检验法,推导出u检验统计量;(3)Logrank比分检验法,推导出u检验统计量;,2、两条或多条 生存曲线的比较,两条生存曲线的比较方法较多,如:(4)Peto-Petos Wilcoxon比分检验法,推导出u检验统计量;(5)Mantel-Haenszels 2检验法(适用于按生存时间分组的两样本生存曲线的比较)。,2、两条或多条 生存曲线的比较,多条生存曲线的比较方法有:(1)时序检验法,即简化的Logrank比分检验法;(2)基于“Gehan比分检验法、Logrank比分检

14、验法和Peto-Petos Wilcoxon比分检验法”推广的多个生存曲线的检验法,以这些方法在ti时点的比分为构造检验统计量的核心内容;(3)似然比检验。,2、两条或多条 生存曲线的比较,这些方法的共同之处就是设法求出一组中的各时间点相对于另一组中各时间点的“比分”或各时间点上的理论频数,从而构造出近似服从正态分布的u检验统计量或近似服从2分布的2检验统计量。,2、两条或多条 生存曲线的比较,合理选用上述检验方法的基本原则:其一、当生存时间的分布为威布尔分布或属于比例危险模型时,Logrank检验效率较高;其二、当生存时间的分布为对数正态分布等时,Wilcoxon检验效率较高;当生存时间的分

15、布为指数分布时,似然比检验的效率高。,2、两条或多条 生存曲线的比较,可用图示法粗略地判定生存时间的分布是否属于威布尔分布或指数分布,具体做法如下,例如:用(t,-logS(t)画图,若成一条直线,表明S(t)呈指数分布;又如:用(logt,log(-logS(t)画图,若成一条直线,表明S(t)呈威布尔分布。,2、两条或多条 生存曲线的比较,当然,也有一些统计检验方法,如:判断是否服从指数分布的检验法、判断是否服从威布尔分布的Mann-Scheuer-Fertig Tiku检验法和判断是否服从对数正态分布的检验法等,具体检验方法参见有关专著。,3、两条或多条生存 曲线比较的实例,例3:某医生

16、收集到35例白血病患者治疗后的生存时间(月),仔细观察后发现这些病人中有一部分人出现了白细胞(WBC)倍增的现象。现将他们按是否出现WBC倍增分成组如下(注:负值代表删失数据)。,3、两条或多条生存 曲线比较的实例,试用生存分析方法分析患者有无WBC倍增,对其生存时间长短的影响有无统计学意义。 A组(有WBC倍增):2,-2.5,3.5,4,4,-5, 6,-6,7,-7,8,-9,10.5,12.5,19; B组(无WBC倍增):2.5,5,7,-8.5,9,-10, 11,-11,12,13,-14,15,-16,17,-18, 19,-20,21,24,32。,3、两条或多条生存 曲线比较的实例,分析与解答:处理该资料所需的SAS程序如下: DATA abc; INPUT lt ; censor=(

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号