第11章,第11章 基本图像分割技术,在对图像的研究和应用中,人们往往仅对图像中的某些部分感兴趣这些部分常称为目标或前景(其它部分称为背景),它们一般对应图像中特定的、具有独特性质的区域为了辨识和分析目标,需要将这些有关区域分离提取出来 图像分割是指把图像分成各具特性的区域并提取出感兴趣目标的技术和过程,第11章,第11章 基本图像分割技术,11.1 图像分割定义和技术分类 11.2 并行边界技术 11.3 串行边界技术 11.4 并行区域技术 11.5 串行区域技术,第11章,图像分割定义 可借助集合概念 (1) (2) 对所有的i和j, ,有 (3) 对i = 1, 2,…, n,有P(Ri ) = TRUE (4) 对 ,有 (5) 对i = 1, 2, …, n,Ri是连通的区域,11.1 图像分割定义和技术分类,第11章,图像分割技术分类 对灰度图像的分割常可基于像素灰度值的2个性质:不连续性和相似性 区域内部的像素一般具有灰度相似性,而在区域之间的边界上一般具有灰度不连续性 分割算法又可分为并行算法和串行算法 分割算法可根据这2个准则分成4类(见表11.1.1):① 并行边界类;② 串行边界类;③ 并行区域类;④ 串行区域类,11.1 图像分割定义和技术分类,第11章,边缘及检测原理 边缘检测是所有基于边界的图像分割方法的第一步 边缘是灰度值不连续的结果,这种不连续常可利用求导数方便地检测到。
一般常用一阶和二阶导数来检测边缘{图11.2.1} 在空域对边缘的检测常采用局部导数算子进行先介绍一阶导数算子和二阶导数算子,再讨论如何将检测出的边缘点连接成曲线或封闭轮廓,11.2 并行边界技术,第11章,一阶导数算子 梯度对应一阶导数,梯度算子是一阶导数算子对一个连续函数f (x, y),它在位置(x, y)的梯度可表示为一个矢量(两个分量分别是沿X和Y方向的一阶导数) 幅度(也常直接简称为梯度)和方向角分别为,11.2 并行边界技术,第11章,一阶导数算子 幅度计算常采用1范数(对应城区距离)或范数(对应棋盘距离) 模板卷积,11.2 并行边界技术,第11章,二阶导数算子 拉普拉斯算子 一种常用的二阶导数算子,实际中可根据二阶导数算子过零点的性质来确定边缘的位置,11.2 并行边界技术,第11章,二阶导数算子 马尔算子 在拉普拉斯算子的基础上实现 马尔边缘检测的思路源于对哺乳动物视觉系统的生物学研究这种方法对不同分辨率的图像分别处理,在每个分辨率上进行如下计算 (1) 用一个2-D的高斯平滑模板与源图像卷积 (2) 计算卷积后图像的拉普拉斯值 (3) 检测拉普拉斯图像中的过零点作为边缘点,11.2 并行边界技术,第11章,二阶导数算子 马尔算子 高斯加权平滑函数 对原始图f(x, y)的平滑结果为 以对r求二阶导数来计算拉普拉斯值,11.2 并行边界技术,第11章,二阶导数算子 坎尼算子 好的边缘检测算子应具有的三个指标 ① 低失误概率,既要少将真正的边缘丢失也要少将非边缘判为边缘 ② 高位置精度,检测出的边缘应在真正的边界上 ③ 单像素边缘,即对每个边缘有唯一的响应,得到的边界为单像素宽,11.2 并行边界技术,第11章,边界闭合 在有噪声时,用各种算子得到的边缘像素常是孤立的或分小段连续的。
为组成区域的封闭边界以将不同区域分开,需要将边缘像素连接起来 边缘像素连接的基础是它们之间有一定的相似性用梯度算子对图像处理可得到像素2方面的信息:①梯度的幅度;②梯度的方向,11.2 并行边界技术,第11章,先检测边缘再串行连接成闭合边界 图搜索 边界点和边界段可以用图结构表示,通过在图中进行搜索对应最小代价的通道也可以找到闭合边界 一个图可表示为G = [N, A],其中N是一个有限非空的结点集,A是一个无序结点对的集集A中的每个结点对(ni, nj)称为一段弧(niN,njN)通路的总代价:,11.3 串行边界技术,第11章,图搜索 定义图中的边缘元素是两个互为4-近邻的像素间的边界,边界由一系列边缘元素构成 每个由像素p和q确定的边缘元素对应一个代价函数,11.3 串行边界技术,代价函数的取值与像素间的灰度值差成反比,灰度值差小则代价大,灰度值差大则代价小,第11章,动态规划 一个借助有关具体问题的启发性知识减少搜索的方法 估计代价 图搜索的算法 (1) 将起始结点标记为OPEN并置g(s) = 0 (2) 如果没有结点OPEN,失败退出,否则继续 (3) 将估计代价r(n)为最小的OPEN结点标记为 CLOSE,11.3 串行边界技术,第11章,动态规划 (4) 如果n是目标结点,找到通路(可由n借助指针上溯至s)退出,否则继续 (5) 展开结点n,得到它的所有子结点(如果没有子结点,返回(2)) (6) 如果子结点ni还没有标记,置r(ni) = g(n)+c(n, ni),标记它为OPEN并将指向它的指针返到结点n (7) 如果子结点ni已标记为OPEN或CLOSE,根据g'(ni ) = min[g(ni), g(n)+c(n, ni)]更新它的值。
将其g' 值减小的CLOSE子结点标记为OPEN,并将原指向所有其g' 值减小的子结点的指针重指向n返回(2),11.3 串行边界技术,第11章,动态规划 通过对图像进行极坐标变换而达到同时解决确定起始点和判断搜索结束这两个问题{图11.3.4} (a) 先在原图像中确定一个包含目标的感兴趣区 域(ROI) (b) 将得到的ROI借助极坐标变换(即用图(a)中 的箭头旋转扫描)转换成一个矩形区域 (c) 在矩形区域顶端选一个起点,利用动态搜索 技术逐行向下搜索直至到达矩形区域底端 (d) 将动态搜索得到的通路反极坐标变换回去,11.3 串行边界技术,第11章,并行的直接检测区域的分割方法 原理和分类 取阈值技术是最常见并行区域分割方法 首先对一幅灰度取值在gmin和gmax之间的图像确定一个灰度阈值T(gmin T gmax),然后将图像中每个像素的灰度值与阈值T相比较,并将对应的像素根据比较结果(分割)划为两类:即像素的灰度值大于阈值的为一类,像素的灰度值小于阈值的为另一类,11.4 并行区域技术,第11章,原理和分类 取阈值分割方法的关键是选取合适的阈值 (1) 全局阈值:仅根据各个图像像素的本身性质f(x, y)来选取而得到的阈值 (2) 局部阈值:根据像素的本身性质f(x, y)和像素周围局部区域性质q(x, y)来选取得到的阈值 (3) 动态阈值:根据像素本身性质f(x, y),像素周围局部区域性质q(x, y)和像素位置坐标(x, y)来选取得到阈值,11.4 并行区域技术,第11章,全局阈值的选取 极小值点阈值 最优阈值,11.4 并行区域技术,第11章,全局阈值的选取 最大凸残差阈值 当图像中目标和背景面积相差较大时,直方图的一个峰会淹没在另一个峰旁边的缓坡里 图像的直方图(包括部分坐标轴)可看作平面上的一个区域,对 该区域可计算其凸包 并求取其最大的凸残 差,用来分割图像,11.4 并行区域技术,第11章,局部阈值的选取 直方图变换 利用一些像素邻域的局部性质对原来的直方图进行变换以得到一个新的直方图,11.4 并行区域技术,第11章,局部阈值的选取 灰度-梯度散射图 一个轴是灰度值轴,一个轴是梯度值轴,而其统计值是同时具有某一个灰度值和梯度值的像素个数,11.4 并行区域技术,第11章,动态阈值的选取 当图像中有不同的阴影(例如由于照度影响),或各处的对比度不同时,如果只用一个固定的全局阈值对整幅图进行分割,则由于不能兼顾图像各处的情况而使分割效果受到影响 用与坐标相关的一系列阈值来对图像进行分 割。
基本思想是首先将图像分解成一系列子图像,对每个子图像计算一个阈值通过对这些子图像所得阈值的插值就可得到对图像中每个像素进行分割所需的阈值,11.4 并行区域技术,第11章,动态阈值的选取 (1) 将整幅图像分成一系列重叠的子图像 (2) 做出每个子图像的直方图 (3) 检测各个子图像的直方图是否为双峰的,如是则采用前面介绍的最优阈值法确定一个阈值,否则就不进行处理 (4) 根据对直方图为双峰的子图像得到的阈值通过插值得到所有子图像的阈值 (5) 根据各子图像的阈值再通过插值得到所有像素的阈值,然后对图像进行分割,11.4 并行区域技术,第11章,动态阈值的选取 区域生长 将具有相似性质的像素集合起来构成区域 先对每个需要分割的区域找一个种子像素作为生长的起点,然后将种子像素周围邻域中与种子像素有相同或相似性质的像素(根据某种事先确定的生长准则或相似准则来判定)合并到种子像素所在的区域中将这些新像素当做新的种子像素继续进行上面的过程,直到再没有满足条件的像素可被包括进来,11.5 串行区域技术,第11章,动态阈值的选取 分裂合并 从整幅图像开始通过不断分裂得到各个区域 (1) 对任一个区域Ri,如果P(Ri ) = FALSE就将其分裂成不重叠的四等分。
(2) 对相邻的两个区域Ri和Rj,如果P(Ri∪Rj ) = TRUE,就将它们合并起来 (3) 如果进一步的分裂或合并都不可能了,则结束11.5 串行区域技术,第11章,教程作者(章毓晋)联系信息,通信地址:北京清华大学电子工程系 邮政编码:100084 办公地址:清华大学东主楼,9区307室 办公:(010)62781430 号码:(010)62770317 电子邮件:zhangyj@ 个人主页: (下载更新的讲稿和教程修改表),。