图像处理算法1_多类别运动目标分类讲解

上传人:我** 文档编号:115652963 上传时间:2019-11-14 格式:DOC 页数:15 大小:840.50KB
返回 下载 相关 举报
图像处理算法1_多类别运动目标分类讲解_第1页
第1页 / 共15页
图像处理算法1_多类别运动目标分类讲解_第2页
第2页 / 共15页
图像处理算法1_多类别运动目标分类讲解_第3页
第3页 / 共15页
图像处理算法1_多类别运动目标分类讲解_第4页
第4页 / 共15页
图像处理算法1_多类别运动目标分类讲解_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《图像处理算法1_多类别运动目标分类讲解》由会员分享,可在线阅读,更多相关《图像处理算法1_多类别运动目标分类讲解(15页珍藏版)》请在金锄头文库上搜索。

1、基于随机森林的多类别运动目标分类算法一、算法设计1.1 目标定位为了描述目标,首先需要确定图像中有可能对应于目标区域的像素集合,即目标定位。目标定位通常有两种常用的处理方法,基于运动的方法和特定目标检索的方法,这两种方法在一定程度上有互补性。基于运动的方法假定是在静止摄像机或静止背景情况下,检测出场景中与背景有相对运动的像素集合,并对这些像素进行去噪、分割等处理以确定可能对应于目标的前景区域。目前,通常运用背景减除法、帧差分法提取出视频图像中的运动区域;跟踪检测到的运动区域;然后对跟踪区域执行分类算法以确定它们的类别。基于运动的目标定位方法主要是根据目标相对于背景运动这一特性来检测目标区域。这

2、种方法的特点是几乎不需要场景中目标类别的任何先验知识,而对检测到的运动区域进行目标分类的工作可以留到分类算法中实现。运动检测处理后,对于提取到的运动目标需要进一步抽取特征,设计分类器以实现目标分类算法。基于图像的特定目标检测方法,不依赖于目标运动,直接在整幅图像中进行全局搜索,判断图像中是否包含属于特定类别的目标。每一幅图像以整体作为输入,然后在整个图像空间中寻找符合感兴趣目标典型特征的像素区域,即比较所有可能的待检测区域与目标模板的匹配度,例如人脸、车辆或花朵等。这种特定目标模板需要事先利用一组属于此类目标的已标记样本进行训练得到。这种方法使用时通常结合边界、小波特征等低级特征和矩形滤波器。

3、由于在整个图像范围内的目标搜索匹配工作计算复杂度很大,消耗时间长,本文的目标检测采用基于运动的方法。基于运动的目标检测分类系统有很大优点,主要是可以将注意力集中在那些很有可能对应于运动目标的前景区域。这简化了目标分类的工作,只用区分检测到的目标区域是否属于某类别,而不用区分目标区域和图像中其它区域,减少了背景和目标之外的其它区域对分类问题的干扰。因此,可以避免背景区域中与感兴趣目标有相似外形特性的区域误检情况发生。基于运动的目标检测方法在每帧中含有的目标数量相对较少时可以大大提高目标检测的效率。检测到运动区域也就相当于自动的提供了关于目标在像素平面的方位与尺度。由于本文选取的视频监控图像背景为

4、静止,采用基于运动块的目标检测方法可以大幅度提高检测和分类的效率,较好的避免背景干扰。对比特定目标检测方法,本方法避免了在图像内多尺度的搜索,计算复杂度低,符合实时检测和分类的需求。此外,采用运动分割可以提供运动物体的轮廓及其在图像中的具体位置,可以为分类提供更多的有效信息。1.2 分类器设计在分类器设计上,目前常用的目标分类方法有贝叶斯分类方法、K最近邻节点算法(K-Nearest Neighbor:KNN)方法和多分类支持向量机(Muticlass Support Vector Machine:MSVM)方法及多核学习(Multiple Kernel Learning:MKL)方法等,但是

5、这些方法仅能够针对目标进行分类,无法像数据挖掘那样抽取其中的分类规则,不能有效的分析得到对目标识别贡献较大的特征。随机森林方法易于抽取直观易懂的分类规则,需要较少的参数调整,适用于数据集中存在多个特征的场合。由于本文的应用场景需要处理多类目标,随机森林算法在训练和测试阶段都优于SVM,同时随机森林算法可以采用多种特征,并估算每种特征的权重。算法的框架如下:图2-1 目标分类识别流程图1.3 特征选取特征在分类过程中是一种非常重要的数据表达方式,特征选取是对分类精度和可靠性影响最大的因素之一。通常来说,选择的特征少,速度快,实现简单,单分类的精度不高;选择的特征太多,速度慢,实现复杂,分类效果也

6、不好。对于属于不同类别的对象来说,它们的特征值应具有明显的差异;相同对象的特征值比较相近;所用的特征之间应彼此不相关。虽然相关性很高的特征可以组合起来减少噪声干扰,但一般不应作为单独的特征使用。模式识别系统的复杂度随着系统的维数(特征的个数)迅速增长,并且用来测试结果的样本数量随着特征的数量呈指数关系增长。本研究中选取了可以表征目标区域的多个特征,并根据各个特征在仿真中的重要性赋予不同的权值,这些特征分别为:纹理特征(10维向量),边缘LBP直方图特征(32维向量),图像块密度(1维),轮廓不变矩(25维向量),椭圆特征(三维向量),外形特征(32维向量)。图2-2 特征选取比例示意图1.3.

7、1 基于灰度共生矩阵的纹理特征灰度共生矩阵17被公认为当今的一种重要的纹理分析方法,是由RWConners等人在1983年提出。灰度共生矩阵是一种优于灰度游程长度法和光谱方法的纹理特征的测量技术。灰度共生矩阵描述方法是基于在纹理中某一灰度级结构重复出现的情况。这个结构在精细纹理中随着距离而快速地变化,而在粗糙纹理中则变化缓慢。图2-3 灰度共生矩阵示意图在图2.3中设oxy为图像像素的坐标平面,灰度坐标为z轴,x方向像素总数为Nx,y方向像素总数为Ny,为了避免众多灰度级给分析带来的庞大计算量,将图像灰度作归并,其最高灰度级是第Ng级。因此,可以将图像f理解为从到的一个变换,也就是说对中的每个

8、点,对应一个属于的灰度。概率表示了两个相距d、方向角相差(=0,45,90,135)的像素的灰度级分别为i和j的可能性。对于一个含有G个灰度级的纹理图像,上述概率可以写成一个的矩阵,该矩阵被称为灰度共生矩阵(Gray Level Co-occurence Matrix,GLCM)。Haralick等人,提出的空间灰度级依存方法,该方法基于对一个二阶联合条件概率密度函数的估计。在灰度级共生矩阵的基础上,可以计算出一组用统计参数来描述纹理特征。利用统计和结构特征,设计了一组16个纹理特征,而且定义了纹理同类基元子区域间的距离。一幅图像的灰度共生矩阵反映了图像灰度关于方向、相邻间隔、变化幅度的综合信

9、息,是分析图像的局部特征和排列规律的基础。对于粗纹理的区域,共生矩阵的元素值集中在对角线附近,而对于细纹理的区域,共生矩阵的元素值将离开主对角线向外散开。由此可以进一步描述图像纹理的一系列特征。根据共生矩阵,可以定义熵(Entropy)、对比度(Contrast)、能量(Energy)、相关(Correlation)、方差(Variance)等16种用于提取图像中纹理信息的特征统计量。由于篇幅关系,仅介绍用到的能量、对比度、相关性和同质性四种特征量。(1) 能量: (2-1)ASM(Angular Second Moment)也称角二阶矩。是灰度共生矩阵元素值的平方和,所以也称能量,反映了图像

10、灰度分布均匀程度和纹理粗细度。如果共生矩阵的所有值均相等,则ASM值小;相反,如果其中一些值大而其它值小,则ASM值大。当共生矩阵中元素集中分布时,此时ASM值大。ASM值大表明一种较均一和规则变化的纹理模式。(2) 对比度: (2-2)反映了图像的清晰度和纹理沟纹深浅的程度。纹理沟纹越深,其对比度越大,视觉效果越清晰;反之,对比度小,则沟纹浅,效果模糊。灰度差即对比度大的象素对越多,这个值越大。灰度共生矩阵中远离对角线的元素值越大,对比度越大。(5)相关性: (2-3)其中,当图像的局部有较小的方差时,则灰度值占有支配地位,当图像的局部有较大的方差时,则纹理占有支配地位。纹理是和局部灰度及其

11、空间组织相联系的,纹理在识别感兴趣的目标和地区中有着非常重要的作用。(4)同质性 (2-4)同质性是图像局部灰度均匀性的度量。如果图像局部的灰度均匀,同质性的取值就较大。1.3.2 边缘LBP直方图特征LBP算子是一种灰度范围内的纹理度量,它从一种纹理局部近邻定义中衍生出来,最初是由ojala18等人为了辅助性地度量图像的局部对比度而提出的。假设图像的局部纹理T的分布可假设认为是局部区域内象素灰度的联合分布密度。 (2-5)其中,表示邻域关系中的中心像素的灰度值,为P个周等距离分布于以中心像素为圆心,半径为R的圆周上的灰度值,如图2-4所示。其中的参数分别为P=8,R=1.0;P=8,R=2.

12、0;P=12,R=2.5。图2-4 LBP算子不同P、R值示意图由于只是描述了整个图像的亮度分布情况,而跟图像的局部纹理无关,因而可以忽略其对于整个分布的影响。如果仅考虑的符号,我们可以发现,它对局部纹理的描述具有对均匀亮度变化的不变性,而不仅仅是对灰度范围内的平移具有不变性。因此在假设中心像素点和周边像素点的差值独立于中心像素点的假设下,公式可以近似为:, 其中为符号函数 (2-6)如果为每个分配一个权值,则可以得到唯一的LBP编码,如下式 (2-7)考察LBP的定义,发现可以产生种不同输出,对应了局部近邻集中P个象素形成的个不同的二进制模式。以P=8,R=1为例,将会生成256种输出。很显

13、然,如果图像发生旋转,那么中心象素点的输出值自然会有所变化,为了消除图像旋转产生的影响,Ojala等又引入了统一化的LBP描述方式: (2-8)其中数字图像经过上述LBP算子运算后,就可以得到变换以后的图像,再对变换以后的图像进行直方图统计,就得到了LBP直方图的表示形式。前面已经提到,由于LBP可以将图像中的微小特征量化为LBP表示的模式,因此直方图统计的物理意义在于直方图向量描述了图像中各个微小特征分布情况。本文选取的LBP特征为32维向量。1.3.3 轮廓不变矩矩在统计学中常用于表征随机量的分布,而在力学中用于表征物质的空间分布。若把二值图或灰度图看作是一维密度分布函数,就可把矩技术应用

14、于图像分析中。从一幅数字图像中计算出来的矩集,通常描述了该图像形状的全局特征,并提供了大量的关于该图像不同类型的几何特征信息。矩是一种全局不变量,它对噪声不太敏感,另外,它不管目标是否封闭,都能较好的识别目标。直接用原点矩或中心矩作为图像的特征,不能保证特征同时具有平移、旋转和比例不变性。事实上,如果仅用中心矩表示图像的特征,则特征仅具有平移不变性:如果利用归一化中心矩,则特征不仅具有平移不变性,而且还具有比例不变性,但不具有旋转不变性。看来,要同时具有平移、旋转和比例变换不变性,直接使用原点矩或中心矩是不行的。为此, Hu首先提出了Hu不变矩19,他给出了连续函数矩的定义和关于矩的基本性质,

15、证明了有关矩的平移不变性、旋转不变性以及比例不变性等性质,具体给出了具有平移不变性、旋转不变性和比例不变性的七个不变矩的表达式。七个不变矩由二阶和三阶中心矩的线性组合构成: (2-9)其中低阶矩主要描述图像的整体特征,如面积、主轴和方向角等;高阶矩主要描述图像的细节,如扭曲度、峰态等。1.3.4 外形特征为了得到目标在不同形态的特征,需要在训练中将不同的目标姿态加到相应的模板库中。以人体为例,为了使不同的人、人的影子、人群被较精确的识别出来,需要列出尽可能多的人体姿态。假设我们训练中采用的直立姿态的人体,那么呈坐姿的人可能会被分到错误的类别。同样,不同角度看到的车辆形态也各不相同。因此需要建立有效的外形特征来表征该类目标的不同形态20。在此假设目标的轮廓存在顺时针方向的n个点,为目标的质心,则距离函数可以由下式得到: (2-10)其中函数为两个点之间的欧式距离。由于不同的目标有不同的形状,也存在不同的大小,相同的目标的轮廓在帧与帧之间也存在差异。为了比较不同大小的目标,使得目标的比较矩阵保持尺度不变性,可以通过下采样和超采样来得到定尺寸的距离函数: (2-11)在下一步中,尺度距离被归一化到积分和区域。归一化后

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号