物体识别的背景－金锄头文库

资源描述

《物体识别的背景》由会员分享，可在线阅读，更多相关《物体识别的背景（4页珍藏版）》请在金锄头文库上搜索。

1、1.1论文研究背景大千世界的物体种类繁多，人们主要通过视觉系统对形形色色的物体进行分类和辨别，统称为物体识别。通过模拟人类视觉系统的视觉信息获取和处理功能以便于计算机具有人类识别物体的能力，出现了计算机视觉和模式识别等研究领域。物体识别(Object Recognition)是当前国内外计算机视觉与模式识别领域的一个活跃的研究方向，在很多方面有了很大的进步。比如对人类的视觉系统有了更进一步的认识、数学工具更高级、计算效率越来越高、越来越多的具有挑战性的数据库收集等，这些进步使得物体识别越来越引起人们的关注。物体识别是机器智能的基本功能之一，它是任何一个以图像或视频作为输入的实际应用系统中

2、的核心问题和关键技术。这类系统的性能和应用前景都依赖于其中物体的知识表示和分类识别所能达到的水平。物体识别技术无论是在军事还是在民用中都有着广泛需求和应用。如智能视频监控、视觉导航、人机交互、计算机取证、各类身份识别和认证系统、数字图书馆和Internet 中的在海量图像库和视频中的基于内容的检索、编码与压缩等等。基于图像的物体识别的过程通常表现为：首先建立待识别物体图像的一种知识表示模型，在一定量的训练样本中学习得到一组满足预定要求的模型参数;同时根据物体图像的表示模型，建立一套从实际图像中进行推理的识别算法，通过在实际图像中测试可获得系统的泛化能力对其进行性能评估。由此可见，物体识

3、别技术的提高，无论在军事还是民用方面都有非常重要的意义。所谓一般物体识别，通俗来说即是使得计算机具有和人类一样的，对于在任意环境下观察到的任意物体进行检测、分割和识别的能力。它作为计算机视觉领域的一个特定然而极为重要的任务，要求在给予一定量的训练样本的前提下，计算机能够学习有关指定物体类别的知识，并在观察到从属于旧类别的新物体时，给出识别的结果。研究一般物体识别，无论对于理论还是实践都有极其重大的意义。计算机视觉的核心在于识别，而一般物体识别又是识别中最为复杂核心的问题，对于神经科学而言，破解了一般物体识别就相当于将神秘莫测的人脑工作机制拉开了帷幕一角，由此展开此后进一步的深入研究，意义不言而

4、喻。在实践中，一般物体识别的研究则能给人类生活的方方面面，尤其是交通、国防、教育带来极为重大的影响，甚至改变人们生活的方式，对整个社会有着深远的意义。一般物体识别与特定物体识别(Specific Object Recognition)的主要区别在于，特定物体识别通过构造高度特化的特征提取及机器学习方法，使用海量的训练样本进行训练，仅仅处理某种物体或是某类物体，典型例子如汽车检测及人脸检测，而一般物体识别面对的问题则要困难得多，概括地来说，它必须使用物体类间通用的一般特征，而不能为某个特定类别定义特征；它必须能处理多类分类及增量学习，在此前提下无法使用给定类别的海量样本进行训练。1.2.

5、2物体识别巫待解决的问题已有的大多数物体表示与识别方法是针对特定的物体实例和表现形式，如字符、人脸、车和车牌等。这种情况下，建模、学习、推理与数据都有很强的针对性，从而也就缺少了通用性和可扩充性。要识别几百类常见物体时将导致物体识别在建模、学习、推理与数据四个方面都遇到很大的挑战，具体而言有以下几点：(1)不同姿态和视角：因为物体在图像中出现的姿态和视角是任意变化的，系统也无法预先知道物体的详细姿态和视角，在不同姿态和视角下，对识别能起到作用的特征是大不相同的。(2)光照的影响：在不同的光照条件下，物体的正确识别率将会急剧下降。其主要原因是硬件的成像与光照的关系并不是线性的。当光线太强时会出

6、现饱和问题；当光线较弱时，阴影部分就会出现信噪比较低的问题。因此，对于如何设计一种有效地避免光线影响对物体识别的影响来说，解决光线问题是关键。(3)遮挡问题：这也是物体识别中无法回避的问题之一。在真实图像中，待识别的物体很有可能被其他物体部分遮挡，就会丧失一些非常重要的信息，使得准确识别目标物体的难度增大。设计一种在目标物体图像因部分遮挡和部分缺失的情况下也能被正确识别的方法，包括最小特征集的确定和选择、特征信息缺失时的识别方法以及遮挡率与识别有效性之间关系的研究就显得十分重要。(4)尺度变化问题：同一类物体可能在大小方面存在较大的差异。图像的各种结构只存在一定的尺度范围内。如何解决尺度

7、变化问题也是物体识别所要解决的一大问难。这就给同一类物体的识别带来了很大的困难。在早期的图像处理和表示中就遇到一个很大的困难，即图像的描述是依赖于图像的尺度的。(5)形状变化问题：同一类物体的形状变化也会使得物体识别的难度加强。比如椅子、桌子等物体几乎都有成百上千种形状，这样就无法采用一种统一的表示方法来表示物体，导致识别难度加大。因此，设计一种能有效地针对同一类物体形状发生变化而对物体识别造成的影响，对物体识别来说也是一个巨大的挑战。2.2图像特征提取方法图像特征提取就是提取出一幅图像中不同于其他图像的根本属性，以区别不同的图像。如灰度、亮度、纹理和形状等等特征都是与图像的视觉外观相对

8、应的；而还有一些则缺少自然的对应性，如颜色直方图、灰度直方图和空间频谱图等。基于图像特征进行物体识别实际上是根据提取到图像的特征来判断图像中物体属于什么类别。形状、纹理和颜色等特征是最常用的视觉特征，也是现阶段基于图像的物体识别技术中采用的主要特征。下面分别介绍一下图像的形状、纹理和颜色特征的提取方法。2.2.1图像形状特征提取形状特征是反映出图像中物体最直接的视觉特征，大部分物体可以通过分辨其形状来进行判别。所以，在物体识别中，形状特征的正确提取显得非常重要。常用的图像形状特征提取方法有两种：基于轮廓的方法和基于区域的方法。这两种方法的不同之处在于：对于基于轮廓的方法来说，图像的轮廓特征

9、主要针对物体的外边界，描述形状的轮廓特征的方法主要有：样条、链码和多边形逼近等；而在基于区域的方法中，图像的区域特征则关系到整个形状区域，描述形状的区域特征的主要方法有：区域的面积、凹凸面积、形状的主轴方向、纵横比、形状的不变矩等。这些关于形状的特征目前已得到了广泛的应用。典型的形状特征描述方法有：(1)边界特征法：该方法的基本思想是通过描述图像的边界特征来获取相应的图像形状参数。其中，边界的方向直方图方法和Hough变换检测平行直线的方法是比较经典的方法。边界方向直方图法首先对图像进行微分以求得图像边缘，然后，做出关于边缘方向和大小的直方图，通常采用构造图像灰度梯度方向矩阵的方法。Hou

10、gh变换检测平行直线的方法是利用图像全局特性将边缘像素连接起来并组成区域封闭边界的一种方法，其基本思想是利用点到线之间的对偶性进行检测的。(2)傅里叶形状描述符法：该方法的基本思想是对图像中物体边界点作傅里叶变换以作为形状描述。傅里叶变换主要是利用区域边界的周期性和封闭性，将二维问题转化为一维问题。采用这种方法就可以由物体的边界点导出三种形状特征的表达：质心距离、曲率函数和复坐标函数。(3)几何参数法：几何参数法是一种更为简单的图像区域特征描述方法，例如采用有关形状定量测度（如矩、面积、周长等）的形状参数法。这种定量测度简单并且可操作性强，在简单的三维物体识别中可以采用。(4)形状不变矩法

11、：该方法的主要思想是利用目标所占区域的矩作为形状描述参数。矩特征主要表征了图像区域的几何特征，又称为几何矩，由于其具有旋转、平移、尺度等特性的不变特征，所以又称其为不变矩。在图像处理中，几何不变矩可以作为一个重要的特征来表示物体，可以据此特征来对图像进行分类等操作。2.2.2图像纹理特征提取图像的纹理是与物体表面结构和材质有关的图像的内在特征，反映出来的是图像的全局特征。图像的纹理可以描述为：一个邻域内像素的灰度级发生变化的空间分布规律，包括表面组织结构、与周围环境关系等许多重要的图像信息。典型的图像纹理特征提取方法有：统计方法（灰度共生矩阵纹理特征分析方法就是典型的统计方法之一），几何

12、法（建立在基本的纹理兀素理论基础上的一种纹理特征分析方法），模型法（将图像的构造模型的参数作为纹理特征），信号处理法（主要是小波变换为主）。2.2.3图像颜色特征提取图像的颜色特征描述了图像或图像区域的物体的表面性质，反映出的是图像的全局特征。一般来说，图像的颜色特征是基于像素点的特征，只要是属于图像或图像区域内的像素点都将会有贡献。典型的图像颜色特征提取方法有：颜色直方图，颜色集，颜色矩。(1)颜色直方图：颜色直方图是最常用的表达颜色特征的方法，它的优点是能简单描述图像中不同色彩在整幅图像中所占的比例，特别适用于描述一些不需要考虑物体空间位置的图像和难以自动分割的图像。而颜色直方图的缺点是它无法描述图像中的某一具体的物体，无法区分局部颜色信息。(2)颜色集：颜色集可以看成是颜色直方图的一种近似表达。具体方法是：首先将图像从RGB颜色空间转换到视觉均衡的颜色空间;然后将视觉均衡的颜色空间量化;最后，采用色彩分割技术自动地将图像分为几个区域，用量化的颜色空间中的某个颜色分量来表示每个区域的索引，这样就可以用一个二进制的颜色索引集来表示一幅图像了。(3)颜色矩:颜色矩方法是基十图像中任何的颜色分布都可以用相应的矩来表示这个数学基础上的。由十颜色分布信息主要集中在低阶矩中，因此，表达图像的颜色分布仅需要采用颜色的一阶矩(mean)、二阶矩和三阶矩就可以了。

展开阅读全文