粘连细胞的识别与分割【摘要】在医学细胞图像中,经常会有细胞重叠和粘连的现象,将粘连在一起的细胞群 单个分开是医学细胞处理中一项重要而困难的问题,对这一情况,文章先通过细胞的形态学 特征识别出待分割的细胞,再提出了一种有效的分割算法:先用最大类间方差法对图像进行 二值化,然后对图像作距离变换,将像素点位置信息转化为灰度信息,再利用分水岭算法, 找到粘连边界点,从而将细胞群分实验证明,该算法能成功地分离粘连细胞【关键词】形态学特征最大类间方差法距离变换 分水岭算法1. 引言生物医学是近年来发展比较迅速的一门新型学科,计算机图像处理技术在生物医学中的 应用也越来越广泛和深入图像分析系统已成为研究细胞学的有力工具,已应用于细胞自动 分类、肿瘤细胞的识别、细胞计数、纹理分析、病理图像检索等方面细胞是生命的基 本单元,细胞的种类很多,但基本结构都是一样的,诊断细胞学就是观察细胞的形态动物 细胞主要由细胞核、细胞质和细胞膜组成细胞核主要是细胞的分裂增值,细胞质显示细胞 的生活机能状态在细胞图像处理过程中,细胞的显微图像在临床诊断中有着重要意义很多临床病症表 现为白细胞数目增多、肿大或者白细胞中细胞核形状与数目发生变化,所以对白细胞数目和 形状的研究有着重要意义。
但是由于染色条件、涂片制备、图像来源、采样光照条件的差 异以及细胞间相互重叠、粘连情况的发生,这种由多个细胞聚堆而成的细胞群通常会严重影 响后续的统计分析,使得对白细胞的计数和识别等后续分析变得困难为此,将粘连细胞分 割成为单个细胞,就成为医学图像处理中必须解决的问题细胞图像的自动分析技术为临床 医学的研究提供了强有力的工具在细胞图像自动分析技术的研究中产生了对能有效分割有 粘连细胞图像的算法的需求,根据图像不同的特征,人们提出了各种算法,如:灰度阈值法、 区域生长法、边缘检测法、松施法等这些算法都要求图像具有某些特定性质,在实际处 理中存在一定的局限性,难以直接使用本文提出了一种利用最大类间方差法对图像二值化提取细胞图像,然后将距离变换和分 水岭算法结合使用,即把处理过的二值图像转换为依据一定规律变化的灰度图,再进行分水 岭分割的方法实验证明该方法能有效、合理、快速分离粘连细胞图像2. 系统设计在形态学上识别癌细胞的主要依据是:与正常细胞相比细胞核发生改变、核体积增大、 癌细胞核常呈不规则的叶状在分割后的二值图像中,细胞核的边缘更加光滑规则形状近似 于圆,因此应用形态特征学特征可以更好的来识别癌细胞。
对识别出来的粘连癌细胞首先利用距离变换将细胞像素点不同的位置信息转化为不同 的灰度信息,再利用自适应二值化的分水岭算法来区分不同的像素点,然后将边界点标出, 边界就将细胞群分开为单个的细胞3. 癌细胞图像的识别根据癌细胞的特性分析可知,癌细胞的细胞核比正常细胞的细胞核大,并且在分割后的 二值图像中,细胞核的边缘更加光滑、规则,形状更近似于圆或椭圆,因此利用上述特性结 合图像处理中的形态学可以用来识别癌细胞对于癌细的判断主要使用的形态学特征包括细 胞核的面积、致密度、矩形度和伸长度⑴面积计算细胞核的面积可用细胞核边界所围的区域所包含的像素数来表示在数字图像中,区 域面积可以定义为区域内所含的像素个数,即可将区域内像素标记为f (m, n) = 1,区域外标记为f(m, n) = 0,则面积为:A=勿m=0习 f (m, n)n=0⑵致密度计算致密度是用来刻画物体边界的复杂程度,也称为分散度,其定义为区域周长P的平方与面积A的比:C = P2 /A (其中P=Ne+ w‘2 No)计算细胞的致密度的步骤:① 计算细胞目标区域的面积② 检测是否为垂直方向连续的周长像素点,并记录垂直方向连续周长像素点的个数 Ny。
③ 检测是否为水平方向连续的周长像素点,并记录水平方向连续周长像素点的个数 Nx④ 计算周长像素点总数Sn⑤ 偶数码的链码的个数为Ne =Nx+Ny,奇数码的链码个数No = Sn- Ne⑥ 利用周长公式计算周长⑦ 将第一步和第六步的结果带入致密度公式计算致密度⑶矩形度矩形度是描述细胞区域与矩形的偏离程度,当细胞区域为矩形时,R取最大值1R = A/(W*H)其中W为宽度,H为高度⑷伸长度E = min(W,H)/max(W,H)细胞区域成细长形,E越小;当细胞区域为圆形时,E =l⑸识别H = £wivi> T其中Wi是权值,T代表阈值,vi代表以上四步的结果,取值为0和1,分别代表细胞 的存在与否由此得到的HAT,说明可以判断为癌细胞;如果H
5. 粘连细胞的分割两个或两个以上的对象相互粘结重叠在一起成为细胞群,在其相粘处必存在形状或灰度 的变化分离粘连血细胞的关键就是要在粘连处准确快速地找到分离点集,最后以这些点集 分离细胞⑴ 综合全局二值化与边缘检测的图像分割方法综合全局二值化与边缘检测的图像分割方法首先对图像进行全局二值化,然后采用二 值化与边缘检测的综合判别法,改善环境光照不均匀的影响,去除了边缘检测后大量的光 斑噪声,检测出目标信息,该算法要求粘连处存在灰度的局部最小值区域,但受光照强弱、 细胞粘连情况不同的影响,局部最小灰度区域很难保证,因而在实际图像处理中合理的分 曲线仍然难于查找⑵算法原理与分析新算法的原理是:首先利用距离变换将细胞像素点不同的位置信息转化为不同的灰度 信息,再利用自适应二值化的分水岭算法来区分不同性质的像素点,然后将边界点标出, 边界就将细胞群分开为单个的细胞距离变换是对二值图像的一种操作运算,它将一幅二值图像转化为一幅灰度图像,在 这幅灰度图像中,每个像素的灰度级是该像素与距其最近的背景间的距离从理论上讲, 要计算一个像素点到背景像素点的最短距离,需要对图像进行全局操作运算,即计算此像 素点与所有背景像素点的距离,再取最小值。
除非这幅数字图像的尺寸非常小,否则这种 全局操作的计算量是非常大的实际运用中的距离变换实现算法是从邻近像素点入手,每 次只计算其与局部相邻的几个像素点距离的最小值,根据全局距离是局部距离按比例叠加 而成的原理,对图像进行前后两次扫描,最终得到近似的距离图像基于上述原理,实践 中用倒角算法来进行距离变换,简单快速,其计算出的距离合理逼近于真实的欧氏几何距 离在二维情况时,倒角算法给出了一个类似于卷积核的模板,以一种类似于卷积的操作 在整幅图像中移动其具体算法:是先把二值图像中背景灰度设为0,目标(细胞)灰度 设为1;然后对图像做两次扫描,前向扫描从左到右,自顶向下进行,后向扫描从右到 左,自底向上进行;一旦模板中心移动到某一目标位置时,模板中的每个元素就与其对 应位置处的图像像素值相加,从而得到一个两项和的集合,位于模板中心的图像像素值就 用这些和中的最小值代替用5X5模板计算的距离与真实几何距离的差距一般为1.96%〜2.02%当然可以采 用更高阶的模板,每次考虑更多邻域的像素点如7X7模板,但其精度也提高不多,大致 在1.28%〜1.97%之间综合考虑差距和计算效率,选用5X5模板,计算出来的距离为 欧氏距离的5倍。
图中*代表模板中心上图为距离变换原理图,左图为原始二值图像,右图为作距离变换并反色(为显示更 清楚,对图像进行了求补反色)后的图像,图中直线为横穿两物体的辅助线从图中看出, 距离变换将二值图像中像素点间不同的位置信息转化为了不同的灰度信息,由于边缘像素 具有较小的灰度值,其在图像中明显地与其他像素区分开来但需要标记的并非是物体的 所有边缘点,而是物体相互粘连处的边缘点,因此本文采用分水岭算法来进行后续处理分水岭算法是新近发展起来的数学形态学图像分割方法首先将图像像素的灰度看作 高度,图像中不同灰度值的区域就对应于山峰和山谷盆地,盆地的边缘就是所谓的分水岭 分水岭的来历就是将一幅图像逐渐沉入一个湖中,图像的最低点先进水,然后水逐渐浸入 整个山谷盆地当水位达到盆地的边缘高度就将溢出,这时在水溢出处建立堤坝,如此直 到整个图像沉入水中,所建立的堤坝就成为分开盆地的分水岭下图演示了这种方法的工 作机理是:假定物体灰度值低,而背景的灰度值高假设沿直线的灰度分布,图像最初在 一个灰度值上二值化灰度值把图像分割成正确数目的物体,但它们的边界偏向物体内部 随后阈值逐渐增加,每一次增加1个灰度级,物体的边界将随着阈值增加而扩展。
当边界 相互接触时,这些物体并没有合并因此,初次接触的点变成了相邻物体间的最终边界 这个过程在阈值达到背景灰度级之前终止,也就是说,在被恰当分割的物体的边界正确地 确定时终止距离变换和分水岭算法原理图⑶算法实现步骤① 利用最大类间方差法对图像进行二值化② 对二值图像作距离变换运算,使用倒角5X5模板,保存灰度级图像,并统计图像 中的最高灰度级G③ 利用分水岭分割算法原理进行分割若220 =0,则进入第二个条件判断;(订) =0,若£ =0则判定为一个新的颗粒(种子48首先设置一个标志数组,数组的每个元素值(初始设定都为0),依次代表图像的 每个像素点的标志位,设定初始分割阈值F=G,标记出最初的颗粒物体,阈值向下每次 递减,进入标记循环我们用两个判据来决定新冒出的像素点是否代表新一个颗粒:(i) 计算此像素点20邻域标志位之和220计算此像素点48邻域标志位之和248数加1)否则不是While(F>0)Do{F=F-1;if(新冒出的点像素值=F){if(此像素周围20邻域标志位都为0) {为新颗粒,种子数加1,且将此时种子数的值赋给该像素的标志位;}else{为已标颗粒的扩展区域,将不为0的标志位的值赋给该像素的标志位;}}else if(此像素周围8邻域标志位都相同){为同一个颗粒,将这个像素点标志位的值赋成与周围8邻域相同;}else{为边界点,将此像素点的像素值赋为0。
}}④ 按照上面进行分割后为了显示更清楚,反色并进行阈值分割(此时阈值选取255, 因为经上述变化后背景点和细胞的粘连处的像素值均为255,细胞的像素值均小于255)⑷实验结果及讨论图2是对细胞原图像(图1)进行最大类间方差法二值化后的结果,由图可知,细 胞呈现严重粘连甚至重叠现象而由图3可见,除极少数粘连特别严重的(重叠部分达 细胞面积一半以上,肉眼几乎无法离开)没有分开,其它的粘连颗粒都被合理地分开, 局部颗粒产生的误差主要来源于图像背景中的噪声,整个算法对图像中粘连细胞的分割 是很成功的图5是对二值化的细胞图像(图4。