基于机器学习方法的前列腺病理切片图像识别（课堂PPT）

资源描述

《基于机器学习方法的前列腺病理切片图像识别（课堂PPT）》由会员分享，可在线阅读，更多相关《基于机器学习方法的前列腺病理切片图像识别（课堂PPT）（86页珍藏版）》请在金锄头文库上搜索。

1、基于机器学习方法的前列腺病理切片图像识别,论文作者:钱民华南理工大学,本文大纲,第一章绪论第二章深度学习的基本方法第三章基于深度学习的前列腺病理图像判断第四章基于空间金字塔的前列腺癌病理图像的识别总结与展望,第一章绪论,课题背景及意义前列腺形态组织特征简述国内外研究现状机器学习方法介绍,1.1 课题背景及意义,最近几十年，随着人们生活水平的提高，健康越来越受到人们的重视，是当前社会最为关注的话题之一。男性生殖系统最常见的恶性肿瘤就是前列腺癌，前列腺癌在西方发达国家的发病率以及死亡率仅次于肺癌，位居男性癌症死亡的第二位。中国则是一直被认为前列腺癌发病率较低的国家，

2、所以在前列腺癌的诊断和研究方面落后于国际水平，同时在国内也落后于肝癌、胃癌、乳腺癌等相对高发病率肿瘤的研究。但近年来，饮食、生活习惯西化以及受到人口老龄化等因素的影响，我国前列腺癌的发病率逞上升趋势，逐步成为威胁中老年男性身心健康的头号杀手。近年来，随着计算机技术以及机器学习方法的发展，计算机辅助诊断(CAD)系统成为临床辅助诊断的一个新趋势。CAD 系统对于病理诊断有许多优点:1) CAD 系统一旦核心算法确定，系统的准确率只与内部核心的算法有关，与人为因素无关，同一幅图像不管诊断多少次，都会是相同的结果；2) CAD 系统能够捕捉到切片的所有区域，避免出现遗漏；3) CAD

3、系统作为辅助，对提高医生诊断的敏感性和特异性有很大帮助；4) CAD 系统能让医疗水平欠发达的地区，也能享受到科技进步所带来的好处。所以，越来越多的专家、学者投入到这一领域中来，前列腺辅助诊断系统的核心算法也成为了研究的热点。,1.2 前列腺形态组织特征简述,正常的前列腺组织学特征正常的前列腺组织有四种明显的结构特征：分叶结构。腺腔和腺叶分割为小叶；大腺腔结构。腺腔内乳头突起使得腺腔呈梅花状结构,腺腔体积较大；腺腔上皮由内外层细胞构成双层的结构；腔内有淀粉样小体。上述结构特征一般不出现在有病变的前列腺组织中。因此，上述四种结构特征弱化甚至消失就是前列腺癌诊断的重要依据。,图 1

4、-1 正常的前列腺病理切片图像,1.2 前列腺形态组织特征简述,1.2.2 前列腺癌的病理特征有癌变的前列腺组织主要有以下特征：腺体结构的紊乱，浸润现象，细胞核的异型。前列腺癌病理图像对应的特征为：腺腔逐渐较小，且腺腔的边界变得平滑，没有凸起；间质纹理比较紊乱，方向不一致；细胞核变大且数量明显变多。,图 1-2 前列腺癌病理切片图像,1.3 国内外研究现状,随着计算机医学图像处理技术的发展，在病理分析和细胞组织形态等研究工作中，数字图像里处理技术的作用越来越大，如何将图像处理、模式识别、机器学习等技术最新的发展运用到医学图像上，已成为当前社会研究的热点之一。在国内，杨振森等人提出了前

5、列腺直肠超声图像中纹理特征的提取方法，应用于前列腺癌的早期诊断，识别准确率达到 90%以上。总体来说，目前国内在前列腺病理切片图像研究方面还处于起步阶段。在国外，Ali Tabesh等人从前列腺病理切片图像中，提取了颜色直方图、分形维数、分形编码特征、小波特征、颜色、形状和纹理等多特征融合，用于前列腺癌诊断和 Gleason 分级，分别取得了 94.5%和 77.6%的准确率。目前国外的研究人员和学者主要工作在特征集类别、分类器选择以及前列腺癌的分类策略方面。,1.4 机器学习方法介绍,近年来，计算机技术和机器学习方法都得到极大的发展，机器学习在图像上的应用也取得了相当大的突破。特别是在 2

6、012 年 ImageNet 目标识别竞赛上，由 Geoff Hinton团队实现的基于神经网络的深度学习的算法以 85%的准确率获得最佳算法，将历届最好成绩提高了 11%，这引起了学术界和工业界的又一波机器学习的热潮。本文在前列腺病理切片图像的识别方面采用了深度学习算法和支持向量机（Support Vector Machine，SVM）分类算法。,1.4.1 深度学习简介,深度学习是一种无监督学习。深度学习的概念最开始来自于人工神经网络的研究。深度学习一般通过组合较低层的特征形成更为抽象的高层表示，从而发现数据特征的分布式表示,如图1-3 所示。,图 1-3 深度学习的特征层级,对象模型,对

7、象的局部特征（边缘特征的组合）,边缘特征,1.4.1 深度学习简介,深度学习算法是基于分布式表达(在上世纪80年代和连接机制一起被引入)的方法。分布式表达所基于的假设是所观测到的数据是由多种因素（并不是所有都被观测到）交互产生的，也就是从其他因子组合中学习一个特殊的因子，这样往往可以推广到其他不可见因子的组合。深度学习加入了这些因子被组织成多层的这个假设（被视为一个先验的未知数据生成过程），对应了不同层次的抽象或组成：高层次的表示是通过改造低层次的表示来获得的。这些因子之间的关系可以被看作类似字典或维基百科中词条之间的关系，尽管这些因子可能是数值的（比如人脸在图像中的位置）或类别的（比如是

8、否是人脸），而在字典中的条目则是纯粹的符号。适当数量的层数和结构相关的因子，也是深度学习算法希望从样本中发现的。,1.4.1 深度学习简介,深度学习算法也涉及其他重要的思想，对应于这些未知潜在因子的广泛先验信念。关于监督学习的有趣任务（比如，给定一张图像，预测出某人的脸是否出现在图像中），一个重要的先验信息就在因子中，解释了再输入的观测变化（比如图像），有一些因子是和预测偏好高度相关的。许多深度学习算法实际上都是非监督学习的框架，比如用许多未标记的图像，并从这些图像中找他一组关于这些图像的好的表示。深度学习在图像分类、语音识别、手写识别等方面都取得了比较好的效果，甚至在一些标准数据库上的实

9、验效果已经超过了传统模式识别的方法。,1.4.2 支持向量机简介,SVM 广泛地应用于统计分类以及回归分析，是一种监督式的学习方法。 SVM 属于一般化线性分类器，这类分类器的特点是他们能够同时最小化经验误差与最大化几何边缘区，因此支持向量机SVM 也被称为最大边缘区分类器。 SVM 是将较低维的向量映射到一个更高维的空间里，在这个高维空间里求得一个最大间隔超平面。在分开数据样本的超平面的两边得到两个互相平行的超平面，分隔超平面使两个平行超平面的距离最大化。假定平行超平面间的距离或差距越大，分类器的总误差越小。,第二章深度学习的基本方法,稀疏自编码受限波尔兹曼机（RBM）栈式自编码神经网

10、络的训练深度信念网络的训练,深度学习算法需要构建深度的架构，有许多方法都可以用来进行构建深度架构，常用的有稀疏自编码（Sparse Autoencoder）、受限玻尔兹曼机（Restrict Boltzmann Machine）、稀疏编码（Sparse Coding）等。本章详细介绍前面两种方法，并分别介绍基于稀疏自编码和受限玻尔兹曼机的深度网络的构建和训练。其中基于稀疏自编码的深度网络称作栈式自编码（Stacked Autoencoders）神经网络，基于受限玻尔兹曼机的深度网络被称作深度信念网络（Deep Belief Networks，DBN）。,第二章深度学习的基本方法,2.1

11、稀疏自编码,稀疏自编码能有效构建出深度神经网络，从而对输入数据进行深度学习。稀疏自编码能够学习出输入数据的稀疏表示，达到降维的目的，该过程为无监督的学习。神经元神经网络模型反向传播算法稀疏自编码的含义,2.1.1 神经元,为了模拟人脑处理信息的特点，就用人工神经元类比生物神经元，人工神经元主要有以下基本特征：神经元之间的联接强度决定信号传递的强弱；神经元之间的联接强度可以随训练改变；信号可以是起刺激作用，也可以是抑制作用；一个神经元接受信号的累计效果决定该神经元的状态；每个神经元可以有一个阈值。,2.1.1 神经元,对于样本集(x(i), y(i)，神经网络算法提供了一种复杂

12、又非线性的假设模型hw,b(x),它具有参数 W，b，可以用这两个参数来拟合我们的数据。神经元是神经网络中最基本的单元。如下图所示:,图 2-1 神经元,2.1.1 神经元,这个神经元是一个以x1,x2,x3及常数项 1 为输入值的运算单元，其输出为：其中函数 f :RR称为激活函数。激活函数将选用 Sigmoid 函数：,（2-2）,（2-1）,2.1.1 神经元,其实，这个神经元的输入输出的映射关系就是一个逻辑回归函数。对于公式(2-2),f(z)导数就如下所示，后面在求参数梯度的时候会用到。,（2-3）,2.1.2 神经网络模型,神经网络由大量的人工神经元联结进行计算。大多数情况下

13、人工神经网络能在外界信息的基础上改变内部结构，是一种自适应系统。现代神经网络是一种非线性统计性数据建模工具，常用来对输入和输出间复杂的关系进行建模，或用来探索数据的模式。下图就是一个简单的神经网络：,2.1.2 神经网络模型,如图所示，使用圆圈来表示神经网络的输入，其中“+1”的圆圈称为“偏置单元”，也就是常数项。神经网络最左边的一层是输入层，最右的一层是输出层。中间所有节点组成的一层被称作隐藏层。图所表示的神经网络有 3 个输入单元(不包括常数项)，3 个隐藏单元以及 1 个输出单元。,图 2-3 基本的神经网络示模型,2.1.2 神经网络模型,用ai(i)表示第 l 层第 i 号单元的输出

14、值。当 l1 时，ai(i)=x，也就是第 i 个特征的输入值。对于给定参数集合 W,b，我们的神经网络就按照函数hW,b(x)计算输出结果。图2-3 的神经网络的计算过程就由以下步骤表示：,（2-4）,2.1.2 神经网络模型,用zi(l) 表示第 l 层第 i 单元输入值的加权总和（包括偏置单元），这样我们就可以找到一种更简洁的表示法。这里将激活函数 f(.)扩展为用向量来表示，那么上面的等式我们就可以表示为:,（2-5）,以上步骤叫作正向传播。,2.1.2 神经网络模型,神经网络也可以有多个输出单元。比如，以下神经网络有两层隐藏层：L2及L3 ，并在L4 层中有两个输出单元。要求解这

15、种神经网络就需要样本集(x(i),y(i)，其中y(i)R2。如果想预测的输出是多个的，那这种神经网络是很适用的。,图 2-4 多个输出单位的神经网络,2.1.3 反向传播算法,反向传播算法是一种监督学习算法，常被用来训练多层感知机。反向传播算法主要由两个环节(激励传播、权重更新)反复循环迭代，直到网络的对输入的响应达到预定的目标范围为止。激励传播环节包含两个步骤：1.(前向传播阶段)将训练输入送入网络以获得激励响应；2.(反向传播阶段)将激励响应同训练输入对应的目标输出求差，从而获得隐层和输出层的响应误差。权重更新则按以下步骤进行更新：1.将输入激励和响应误差相乘，从而获得权重的梯度；2

16、.将这个梯度乘上一个比例并取反后加到权重上。,2.1.3 反向传播算法,反向传播算法的思路如下：给出一个样本(x,y)，首先进行前向传导运算，计算出通过网络的所有激活值，包括hW,b(x)的输出值。之后，针对第L层的每一个节点 i，我们想要计算出残差 i(l)(德尔塔)，该残差表明了该节点对最终输出值的残差产生了多少影响。对于最终的输出节点，可以直接得出网络产生的激活值与实际值之间的差距，将这个差距定义为i(nl)，第n1层代表的是输出层。将基于节点残差的加权平均值计算，这些节点以ai(l)作为输入。下面将给出反向传播算法的细节：,2.1.3 反向传播算法,2.1.4 稀疏自编码的含义,图 2-5 自编码神经网络,2.1.4 稀疏自编码的含义,稀疏性数学意义可以按如下解释，如果当神经元的输出接近于 1 的时候我们认为它被激活，而输出接近于 0 的时候认为它被抑制，那么使得神经元大部分的时间都是被抑制的限制则被称作稀疏性限制。,2.2 受限玻尔兹曼机(Restrict Boltzmann Machine),受限玻尔兹曼机（RBM）是一类具有两层结构、对称连接且无自反馈的随机神经网

展开阅读全文