浅析人工智能与检验医学辅助诊疗现状

举报
资源描述
浅析人工智能与检验医学辅助诊疗现状 摘要:随着互联网、大数据及云计算等新兴技术的快速发展,人工智能(AI)已被广泛应用于影像和病理临床辅助诊疗。检验医学作为现代医学的重要支撑,与AI的融合势在必行。该文重点介绍了检验大数据如何与AI结合以构建检验AI,并展望了检验AI在疾病诊断、预测及风险评估等临床辅助诊疗领域的应用前景。 关键词:人工智能;检验医学;检验人工智能系统;临床辅助诊疗 人工智能(AI)是研究、开发用于模拟、延伸和扩展人类智能的一门新兴的科学技术[1]。AI自诞生以来,经过不断的演进与发展,在越来越多领域得以重视和应用。目前,AI技术已广泛应用于医疗领域,出现了影像AI[2]、手术机器人[3]、药物研发AI[4]等诸多应用场景。检验医学作为临床辅助诊疗体系中不可或缺的部分,贯穿患者入院、出院、药物治疗等过程,影响着患者的医疗服务质量[5-6]。检验医学具有高度自动化、数据化及数据库存储等特点为检验AI的应用与研发创造了有利条件[7-8]。为此,本文结合AI在当下临床辅助诊疗中的应用现状,重点阐述检验医学如何与AI融合构建检验AI,并展望检验AI在辅助临床诊疗中的应用前景。 1AI与临床辅助诊疗 随着深度学习技术在目标检测、图像分类及图像分割等领域取得突破性的进展,影像AI和病理AI已成为新的医学研究热点[9]。目前,影像AI和病理AI已成功应用于疾病的筛查、预测及诊断等领域。比如,ZHANG等[2]构建了一个包括新型冠状病毒肺炎(COVID-19)、常见肺炎及正常对照人群的大规模CT数据集,并基于CT图像开发了COVID-19AI诊断系统,用于帮助准确诊断COVID-19。TERAMOTO等[10]使用深卷积神经网络开发了微观图像中的肺癌细胞病理自动分类模型,使约71%的肺癌细胞得到正确分类,且分类正确的图像具有典型的细胞形态和排列。然而,影像和病理诊断具有局限性。一方面,病理切片后诊断周期较长、费用较高,影像学检查相对迅速但费用也相对较高。另一方面,病理和影像检查结果仅仅是一些特定疾病的部分参考指标,无法反映患者疾病的整体情况。相较于影像和病理检查,实验室检验具有显著优势。首先,实验室检验方法简单、快速且成本低,医生通过分析患者的检验数据即可实现良好的诊疗效果,可提高临床医生的诊疗效率并减轻患者的医疗负担。此外,血常规、血生化、尿液或粪便等检验结果可直接反映疾病的生理及病理变化过程。临床上常用的检验数据具有足够的有效性和稳定性,已经过大规模的临床实践和评估,并广泛用于诊断、排查、分类或监测各种疾病,可以为临床医生疾病诊疗提供一个更为全面的指导建议[11]。目前,检验数据的真实诊断效能通常被低估,主要是由于个体化检验数据复杂多变,不同的异常检验结果对应的临床意义不同,联合意义则更多、更广。临床医生面对众多异常检验结果时,由于受限于人脑的推理和计算能力,即使是经验丰富的医学专家也经常忽略众多结果之间隐藏的关键信息和重要趋势,不可避免地造成疾病的漏诊与误诊。因此,使用AI方法集成和分析检验数据为提高检验数据的诊断价值提供了巨大的应用前景[12]。 2基于检验数据的检验AI 2.1检验AI构建的基本条件 目前,构建检验AI的基本条件已经基本具备。首先可从医院检验信息系统(LIS系统)中获得大量检验数据。LIS已成为当今医院管理信息(HIS)系统的重要组成部分,该系统存储了海量的检验数据[13],能够为检验AI的构建提供大数据支持。其次,机器学习(ML)算法层出不穷。比如,极端梯度提升(XGBoost)作为当前比较流行的集成学习算法,在提升树模型中,具有非常强的扩展性和灵活性,能够集成多个树模型来建立一个更强的学习模型[14]。包括XGBoost在内的ML算法是一种通过自动分析数据以获得特征规律,并利用这些规律对未知数据进行预测的算法,是实现AI的基本方法[15]。对于给定的任务,ML算法可以从数据中学习,筛选大量变量并寻找可靠的组合预测结果,所以其对数量庞大或复杂的数据进行挖掘分析具有绝对优势。由此,使用ML算法对LIS中存储的数千万患者信息进行挖掘、训练、建模是完全可行的。这种方法不仅解决了传统统计模型参数限制的问题,还能减少人工误差,提高筛选效率,更重要的是有助于发现数据间的潜在关联及隐藏价值。最后,算力为检验AI提供了基本的计算能力支撑。算力的核心在于AI芯片。由于原有的CPU和传统计算架构已无法支撑ML算法并行计算能力的要求,AI芯片的出现使得AI高强度、大数据的处理需求得以满足。目前,针对AI领域运算特征,AI芯片已成功应用于图像识别、语音识别、声纹检测、视频检索及自动驾驶等任务。在做智能处理任务时,AI芯片能够使计算机以大规模、低成本、高通量、自动化等方式运行[16]。这些均为检验AI的实现和应用提供了强大的硬件平台。 2.2检验AI的构建过程 检验数据只有与AI深度融合形成检验AI,才能充分挖掘检验指标与疾病之间隐藏的联系与规律,为临床提供更有意义的诊疗信息,体现检验医学的价值。检验AI的构建(图1)主要包括以下步骤(1)数据收集和预处理:检验数据来源广泛,由于各数据库(LIS、HIS系统)之间缺乏有效协调机制,联系和沟通不同,采集和存储标准不一,影响了检验数据的应用[17]。因此,检验数据在用于建模前需要经过预处理(包括结构化、标准化、归一化等)转变成ML算法能够识别和学习的数据格式。模式识别作为AI技术的重要分支,能够将多个标准来源数据分类并结构化,节省大量的人力物力,解决了不同数据库的互联互通[18]。(2)检验知识图谱筛选:临床医生在疾病诊断过程中,一些疾病诊断结果可能不依赖于异常检验结果而直接通过B超、放射或病理等辅助检查结果得出。由于检验AI是基于检验数据的AI模型,如果一些疾病诊断结果不能通过相应的异常检验结果推理得出,不仅增加了检验AI数据处理的难度,而且会降低模型预测疾病的准确率。通过人工鉴别异常检验结果是否与疾病诊断结果相关,往往会出现其复杂程度超越了临床医生知识范畴的情况。因此,通过检验知识图谱从医学专业角度将检验数据与诊断数据相关联,排除了一些缺乏知识关联的数据信息,提高了输入数据的质量,同时也增强了模型学习的能力[19]。(3)特征选择与建模:在开发检验AI时,特征变量的选择非常重要,直接影响模型在临床研究中的表现。从特征自身角度选择利用的原理为重要的特征应该是携带信息较多,也就是特征值差异较大的变量。从输入特征和输出特征相关性角度选择主要是利用一些模型算法本身的特点,构造不同特征与目标特征之间的相关重要程度,若重要性低的特征变量(如低于某阈值)则可以抛弃。建模方法主要包括监督学习和无监督学习[20]。监督学习是使用有诊断结果标注的检验数据训练开发模型,之后,所得模型用于预测或诊断新数据集的结果变量。无监督学习则仅使用无诊断结果标注的输入数据来建模。(4)模型评估:模型的性能可以使用同一来源(内部验证)或独立来源(外部验证)数据进行评估。交叉验证方法是一种准确的内部验证方法[21]。交叉验证的最简单形式是将数据集划分为训练集(用于开发模型)和测试集(用于评估模型的性能)。训练集和测试集之间没有最佳划分,例如研究人员习惯将80%的研究人群分配给训练集,其余20%分配给测试集。然而,这种方法可能会使结果产生偏差,使得模型不具有普适性。n倍交叉验证是一种替代方法,在这种方法中,数据集被划分成n个大小相等的分区,执行多轮交叉验证(即每轮使用不同的分区作为测试集),平均结果用于估计模型的性能。模型的外部验证即用非建模数据集测试模型的性能,提高其推广性以支持模型的普适性。(5)临床验证:为了证实检验AI具有很高的临床应用价值,即可以有效辅助临床医生进行临床决策,需要将检验AI诊疗性能与医学专家进行比较。(6)模型应用:为了将检验AI运用到临床实践中,需要基于互联网技术开发相应的应用程序以方便临床医生使用,使得检验AI可以在真实场景运行以获得疾病的预测值等。 3检验AI在辅助诊疗中的应用前景 3.1疾病诊断 快速而准确的诊断对于指导患者的诊疗活动至关重要,检验AI基于检验数据可辅助临床医生进行疾病诊断。比如,GUNCAR等[22]使用了随机森林ML算法并基于实验室血液检测结果,建立了两种模型用于血液疾病诊断,一种预测模型(SBA-HEM168)使用所有可用的血液测试参数;另一种预测模型(SBA-HEM061)仅使用一组简化的血液测试参数。两种模型在诊断血液疾病上都具有良好的诊断性能,在预测患者5种最可能的疾病时,预测准确率分别为0.88和0.86;仅考虑患者最可能的疾病时,预测准确率为0.59和0.57[22]。此外,临床试验表明两种预测模型的准确性与血液学专家相当[23]。本课题组采用了730113例合格参与者的89116949个检验数据和10423581个实验诊断数据,构建了基于知识和数据双驱动的多功能智慧检验平台[23](即检验AI),能够自动识别并综合分析2071种检验指标,完成对包括呼吸系统及血液系统等在内的10种器官系统疾病和441种具体疾病诊断的多元关系推理,且所有推理过程具备良好的可解释性。 3.2疾病预测 检验AI可深度挖掘常规检验指标隐藏的信息,能更好地预测疾病。目前,肿瘤的预测仅限于几种特定的标志物。PATRíCIO等[24]开发了基于常规检验指标的乳腺癌预测模型,研究人员运用了逻辑回归、随机森林和支持向量机3种不同的ML算法以不同数量的变量(包括葡萄糖、抵抗素、年龄、体质量指数、胰岛素抵抗指数、瘦素、胰岛素、脂联素、单核细胞趋化蛋白-1)作为预测因子构建了乳腺癌预测模型。该研究发现,支持向量机预测模型仅使用葡萄糖、抵抗素、年龄和体质量指数作为决定因素即可预测女性乳腺癌的存在。同时,该预测模型在测试集上实现了高灵敏度(82%、88%)和高特异度(84%、90%)的预测[24]。该研究充分证实基于检验AI,一些常规检测参数完全可以替代一些肿瘤标志物成为新的癌症早期筛查工具[24]。SOMNAY等[25]使用术前血清钙、磷、甲状旁腺激素、维生素D和肌酐水平作为原发性甲状旁腺功能亢进的潜在预测因子构建了ML模型,在所测试的ML模型中,贝叶斯网络模型被证明是最准确的,对95%的原发性甲状旁腺功能亢进患者进行了正确分类[曲线下面积(AUC)=0.99],值得注意的是,从模型中省略预测因子甲状旁腺激素并没有明显降低其准确性。该研究表明即使在患者出现轻微疾病病理变化的情况下,ML模型仍可准确预测出原发性甲状旁腺功能亢进症[25]。 3.3疾病风险评估 检验AI可以根据检验数据对患者疾病进行风险评估,为临床医生改进治疗策略做出预警。对于COVID-19,快速准确地识别和评估疾病的严重程度至关重要。MA等[26]收集了COVID-19患者入院临床数据,包括症状、合并症、人口统计学、生命体征、CT扫描结果及检验数据,应用多元逻辑回归方法确定具有统计学意义的临床特征,研究人员最终使用了乳酸脱氢酶、C反应蛋白和年龄作为死亡预测因素构建了多元逻辑回归模型,用于识别CO-VID-19入院患者的严重程度并评估其死亡风险。该模型预测292例患者病死率的效能(AUC=0.9521)优于肺炎CURB-65评分模型(AUC=0.8501)和XGBoost模型(AUC=0.4530)。由数十个临床症状和检验数据(如静脉曲张程度、纤维蛋白原水平和红斑等)作为患者出血风险的潜在决定因素所构建的ML模型能够预测肝功能受损儿童食管静脉曲张出血的风险,该模型能够准确地预测约85%儿童患者食管静脉曲张破裂出血情况,使高危儿童患者能够优先进行紧急肝移植,该研究结果已通过在线应用程序(ht-tp://),在独立患者队列中得到了验证[27]。 3.4疾病治疗与预后检验AI可根据检验数据评 估患者的疾病治疗及预后情况。比如,鉴于华法林的复杂特性,LIU等[28]使用了两个经典的检验数据即丙氨酸氨基转移酶及血清肌酐,结合患者的华法林使用剂量、性别、年龄和体质量
展开阅读全文
温馨提示:
金锄头文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档


电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号