BP神经网络在生存分析中的应用

资源描述

《BP神经网络在生存分析中的应用》由会员分享，可在线阅读，更多相关《BP神经网络在生存分析中的应用（11页珍藏版）》请在金锄头文库上搜索。

1、1BP 神经网络在生存分析中的应用作者：李丽霞,郜艳晖, 张丕德,张瑛,邹宇华【摘要】目的探讨 BP 神经网络在生存分析中的应用。方法通过贲门癌预后的实例说明神经网络的连续时间模型与离散时间模型的使用。结果所建立的神经网络生存分析模型有较好的预测能力。结论神经网络在生存分析中有很大的灵活性，在模型中可以容纳非线性效应，协变量的效应可以随时间而变化，不要求满足 PH 假定，有较广泛的应用前景。【关键词】 BP 神经网络；生存分析；贲门癌Abstract:Objective To explore the application of BP neural network in the

2、 survival analysis.Method Three approaches have been illustrated how to fit survival model for carcinoma of the gastric cardia.Results The neural network models have good predictive ability.Conclusion BP neural network is very flexible without making assumption of proportionality of hazards,it can a

3、llow non-linear predictors and the effect of the covariates to vary over time,so it has broad application prospects.2Key words:BP neural network; survival analysis; carcinoma of the gastric cardia生存分析（survival analysis）起源于 19 世纪对寿命表的分析，目前已广泛应用到临床研究中，可以处理含有删失值的数据，可以同时考虑事件发生的结局及发生结局的时间。目前处理生存资料的方法有参数模

4、型、非参数模型及半参数模型。参数模型对生存时间的分布要求非常严格，医学资料中很少能满足；生存分析中传统的回归模型，例如：Cox 比例风险模型、加速失效时间模型也要求模型满足一定的假设前提，而实际数据往往难以满足这些假设。神经网络近年来受到普遍的关注，在医学领域中的应用主要预测与分类，与传统回归模型不同，它可以克服这些缺点，在模型中可以容纳非线性效应，交互效应、协变量的效应可以随时间变化。目前国内研究神经网络在生存分析中的应用尚较少，本文拟探讨几种不同的神经网络生存模型在贲门癌预后中的应用。1 方法BP 神经网络是目前应用最多的神经网络，一般由一个输入层（input layer）、一个输出层（

5、output layer）、一个或几个中间层（隐层）组成，每一层可包含一个或多个神经元，其中每一层的每3个神经元和前一层相连接，同一层之间没有连接。输入层神经元传递输入信息到第一隐层或直接传到输出层，隐层的神经元对输入层的信息加权求和，加一个常数后，经传递函数运算后传到下一个隐层（或输出层），常用的传递函数是 logistic 函数，即h=1/(1+exp (z)，输出层神经元对前一层的输入信息加权求和经传递函数 0（线性或 logistic 函数或门限函数）运算后输出，例如：如果输入为 xi，对于含一个隐层的神经网络可以得到：g(xi,)=0(k+ikwikxi+jwjkh(j+iwij

6、xi)（1）表示未知的参数矢量（即各层的网络权值），BP 神经网络一般采用 BP 算法训练网络，训练开始时选择初始值 0，BP 算法通过梯度下降法得到估计值，使得 g(x,)能很好地估计实测值，关于BP 算法及改进可参考相关文献1 。利用 BP 神经网络模型建立生存分析模型，常用的方法有：连续时间模型（continuous time models）与离散时间模型（discrete time models）。1.1 连续时间模型（ continuous time models）最常用的是 Faraggi 和 Simon2 提出的方法，在 Cox 比4例风险模型中,风险函数与时间、协变量有

7、如下关系：h(t,xi)=h0(t)exp (xi)（2）通过最大化偏似然函数，使用 Newton-Raphson 法得到参数的估计值，现在使用神经网络的输出值 g(xi,)来代替（2）中的线性项 xi，比例风险模型变成 h(t,xi)=h0(t)exp g(xi,) ，有偏似然函数：Lc()=iuexp jwjk/(1+exp (wijxi)/jRiexp jwjk/(1+exp (wijxj)(3)g(xi,)可以依赖时间和协变量变化，也就是说协变量的效应可以随时间而变化，这给我们提供了一个可以处理删失变量但又不需要满足比例风险模型的 PH 假定的可供选择的方法。1.2 离散时间模型（ d

8、iscrete time models）常用的模型有3 ：（1）直接预测患者是否可以存活到某年(例如 5 年) ，是最简单的神经网络模型，模型的输出层只有一个神经元结点，如欲预测多个时间点，则需建立多个神经网络模型（每个模型对应一个时间区间)；（2）多个输出结点的单个神经网5络模型。1.2.1 输出层有单个结点的神经网络模型是一个标准的分类神经网络模型，生存时间被分成 2 个区间，例如生存时间是否大于5 年。其似然函数为：patientsptii(1-pi)(1-ti)其对数似然函数为：patientstilog pi+(1-ti)log (1-pi)pi：第 i 个病人死亡的概率，ti：

9、第 i 个观测在某时间点（例如 5 年）的结果，如观测死亡，取值为 1，否则取值为 0。对于删失的观测不能简单地排除，这样会造成偏性，我们使用 Cox 线性比例风险模型产生的个体预测值对删失值做填补。1.2.2 输出层有多个结点的神经网络模型将生存时间分成几个离散的区间，估计某个区间事件发生的概率。不考虑时间区间的顺序，有模型： log pk-log p1=k(X)(k=2,P)6从神经网络可以得到输出值yk：yk=iwikxi+jwjk1(iwijxi) （K=1，P）（这里我们设 k(x)=yky1），于是可以得到时间区间 k 的概率：pk=exp (yk) l(yl)建立似然函数

10、patientsli k=mi+1pkimi：观测 i 存活的前一个生存区间，li：最后的时间区间，pki：第 i 个病人在时间区间 k 死亡的概率。本次研究采用灵敏度、特异度、一致性指数 C(concordance index)4,5作为预测准确性的评价指标。一致性指数 C 是对含有删失数据的 ROC 曲线下面积的推广(generalization)，是指预测结果和实际结果一致的观察单位的对子数占总的有用对子数的比例,即C=一致的对子数/ 有用的对子数， C 接近 0.5 表明模型的预测性能差，接近 1 表明预测性能好。一致性指数的计算步骤为5 ：产生所有的病例配对。若有 n 个观察个体,则

11、所有的对子数为C2n。排除两种对子: 对子中具有较小观察时间的个体没有达到观察终点及对子中 2 个个体都没达到观察终点。计算有用对子中,预测结果和实际相一致的对子数,计算一致性指数。72 实例分析贲门癌是常见恶性肿瘤,对 236 例经手术切除但未行放化疗的贲门癌患者随访，生存时间为确诊到最后一次随访，按月记录，分析的协变量包括：性别、年龄、肿瘤的长度、组织学类型、大体分型、浸润深度、淋巴结转移情况、TNM 分期等临床上可能的预后因素。为了减少训练时间，先采用 COX 比例危险模型对可能影响预后的因素进行筛选，采用向前逐步法，引入标准为 0.05，剔除标准为0.10，结果显示对贲门癌患者生存率有

12、影响的因素为：病人的肿瘤长度、淋巴结转移情况、组织学类型、筛选结果见表 1。表 1 贲门癌患者生存的 COX 逐步回归分析结果（略）Tab.1 The result of Cox regression model for carcinoma of the gastric cardia2.1 BP 网训练集、校验集和测试集的确定从原始数据中随机抽取 80 例作为训练集， 80 例作为校验集，76 例为预测样本。2.2 输入数据的预处理8使输入变量的取值落在 0 到 1 的范围内。对于肿瘤长度使用xi=xi max (x)进行归一化处理；病理分型为无序分类变量，以哑变量的形式赋值。2.3 神经网络

13、模型的建立及训练选取 Cox 回归选出的 3 个变量作为网络的输入。建立输出层为 1 个结点的离散型神经网络时，将病人生存时间按下式分为两类作为输出变量yi（i=1,2,n），即 yi=1 生存 t5 年0 生存 t5 年；建立输出层为 5 个结点的离散型神经网络时，将病人生存时间分为 5 类作为输出变量 yi，time1 year，1 yeartime2 year，2time3 year，3time5year。使用 Matlab 软件建立神经网络模型，学习率为 0.01，传递函数采用 logistic 传递函数, 单结点网络的隐单元数为 2，多结点网9络隐单元数为 3，采用 “早停止”策略

14、防止过度拟合。2.4 两种神经网络模型预测性能使用灵敏度、特异度、一致性指数 C 评价模型的预测性能。表 2 两种神经网络模型预测性能*（略）Tab.2 The predictive performance of three type of neural network*判断界值取 0.53 讨论神经网络已在语音识别、图像诊断分析、临床诊断、高分子序列分析等许多方面取得了成功的应用，在医学研究领域，变量间关系往往非常复杂，神经网络正逐渐变成分析数据的流行工具，目前主要应用于分类与预测，用于生存分析方面的研究还较少。国内黄德生5等建立利用 BP 神经网络建立 time-coded model

15、和single-time point model 用于肺鳞癌预后预测，贺佳6等对肝癌术后无瘤生存期的预测做了应用尝试。10本文通过实例建立连续时间模型与离散时间模型探讨 BP 神经网络在生存分析中的应用，Faraggi 提出的方法还可以扩展到其他可以处理删失数据的模型,例如加速失效时间模型、Buckley-James 模型，但哪一种模型更好，还有待进一步研究。神经网络在生存分析中的应用主要在于7：个体患者预后的预测，研究预后因子的重要性，研究预后因子的相互作用；对于预测变量的影响力强弱，解释性还有待进一步探讨。还有研究者在建立多个时间区间的模型时将时间区间也作为一个输入变量，也有学者将神经网络

16、纳入 Bayes 方法的研究框架，神经网络建立的生存分析模型可以探测复杂的非线性效应，复杂的交互效应，相信会逐渐应用到生物医学研究领域。【参考文献】1余雪丽.神经网络与实例学习M .中国铁道出版社,1996:56-61.2DAVID F,RICHARD S. A neural network model for survival dataJ . Statistics in Medicine,1995,14:73-82.3RUTH,RIPLEY,ADRIAN L,et al. Non-linear survival analysis using neural networksJ. Statistics in 11Medicine,2004,23:825-842.4贺

展开阅读全文

BP神经网络在生存分析中的应用

最新文档