基于空间邻域词袋模型的图像标注技术

资源描述

《基于空间邻域词袋模型的图像标注技术》由会员分享，可在线阅读，更多相关《基于空间邻域词袋模型的图像标注技术（61页珍藏版）》请在金锄头文库上搜索。

1、华中科技大学硕士学位论文基于空间邻域词袋模型的图像标注技术姓名：常峰申请学位级别：硕士专业：计算机应用指导教师：陶文兵 2011-01 华中科技大学硕士学位论文华中科技大学硕士学位论文 I 摘摘要要图像目标自动识别标注是计算机视觉研究的一个重要问题，在最近几年得到了很大发展。如基于 SIFT(Scale-invariant feature transform)关键点特征的词袋模型技术，在图像场景分类及目标识别标注中均得到了很好的应用。但是仍然存在很多问题，如尺度变换、光照变换、多视角变化、同种类别间的差异以及类别的增多等给识别

2、标注造成了很大困难。针对传统的目标自动识别标注所存在的一些问题，在如下几个方面做出了一些创新性工作： 1) 基于用户先验的交互式目标提取的框架，将两类交互式图像分割问题拓展到多类情况。结合多层图模型，利用用户的初始画笔信息最优化全局能量函数，获得图像的分割结果。 2) 提出了基于字典的空间邻域特征，在描述图像特征时，考虑到词袋模型忽略了图像的空间结构关系，将图像的局部空间关系也融入到特征矢量中，改进了基于图像关键点的识别方法，并将此方法应用到场景分类中，取得了较好的识别结果。 3)融合了基于多分割的图像预处理技术和区域邻域直方图统计信息，并结合条件随机场进行优化，研究如何利

3、用图像分割指导目标识别问题，然后结合自顶向下和自底向上的学习方法，识别和定位图像中的目标。最后通过多个分类器的投票，来决策最终识别的结果。实现了自动图像标注系统和交互式目标提取系统，给定一幅图像，通过模式识别和机器学习等方法，自动的标注该图像中存在的目标及其位置，在一些主流数据集上达到了较高的识别率。关键词：关键词：目标识别，条件随机场，上下文信息，图像分割，图切割，能量优化，词袋模型华中科技大学硕士学位论文华中科技大学硕士学位论文 II Abstract Image annotation is an important proble

4、m in computer vision research,a lot of breakthroughs has been made in recent years, popular bag of words model is one of the most important research results, it has proven to be very effective in scene classification and object recognition tasks. Although recognizing objects and scene in an image is

5、 still difficult when images include occlusion, scaling change, illumination change and differences between instances, and this task becomes more challenging as the number of categories increase. This paper mainly focuses on these problems and put forward new proposed innovative research, as follows

6、: Firstly, we introduce a user priori based interactive object extraction framework and expand the algorithm to multi-label problems. By combining a multi-graph model and the user brush and the global energy optimization model, we present more fast and accurate object segmentation results. Secondly,

7、 when extracting features from images, traditional bag of features model fail to capture image spatial construction. In this paper we add the spatial information into the model, As a result, we not only describe the image appearance statistical information, but also integrate the image local space i

8、nformation into the features .In the end, we demonstrate clear improvements in image scene classification problems over traditional bag of features model. Thirdly, we combine the image segmentation technique and conditional random field optimization, and integrate the spatial feature to solve automa

9、tic image annotation problem. We also show how to use image segmentation methods to guard image recognition problem by including the top-down and bottom-up way into a unified framework, and we obtain good results in object recognition task on PASCAL 2007 dataset. We implement a automatic image annot

10、ation system and an interactive object labeling system .Given an image, we can automatically locate and identify objects within the image by machine learning and pattern recognition techniques. At last, we present our state of the arts results on those most popular image recognition datasets. Keywor

11、ds: object recognition, conditional random fields, context information, image segmentation, graph cuts, energy optimization, bag of feature 独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知，除文中已经标明引用的内容外，本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体，均已在文中以明确方式标明。本人完全意识到，本声明的法律结果由本人承担。学位论文作者签名：日

12、期：年月日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定，即：学校有权保留并向国家有关部门或机构送交论文的复印件和电子版，允许论文被查阅和借阅。本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索，可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密，在_年解密后适用本授权书。不保密。（请在以上方框内打“”）学位论文作者签名：指导教师签名：日期：年月日日期：年月日本论文属于华中科技大学硕士学位论文华中科技大学硕士学位论文 1 1 绪绪论论

13、 1.1 研究背景与意义研究背景与意义随着计算机科学技术的发展，每天产生的图像数据日益增多，对图像数据的解析也越来越重要。图像识别的基本任务是分析图像数据中存在的目标及其位置信息，是计算机视觉和模式识别领域研究的一个热点和难点问题。给定一张自然图像，如何由计算机分析出其中的目标，比如图像中是否存在天空，草地，人，牛羊等目标以及指出这些目标所在的位置，是目标识别研究的主要问题。目标识别主要应用如下： 1)基于内容的图像检索1：随着互联网及电子商务的迅速发展，对一些多媒体数据的存储及检索的需求日益增大，对快速和准确检索的需求也越来越高。 2)人脸识别：在一些安检场所，人脸的检测和识

14、别应用比较广泛。 3)车辆识别和跟踪：识别交通场景中的车辆及行人，以及对一些异常行为事件做出预测和报警。 4）医学图像的识别：在医学领域，对一些器官组织的识别和对一些疾病的诊断，图像识别的很多关键技术已经渐渐运用到其中。 5）视频检索：随着互联网视频数据的增长和人们生活品味的提高，如何在海量视频中找到自己感兴趣的数据，成了很多学者研究的问题。 6) 机器人视觉：对周围目标的识别和准确分析，是机器人做出正确动作的保证和基础。同时，虽然图像识别工作近些年已经被广泛研究，很多问题仍有待解决。 1)光照的影响：白天和晚上同一物体机器可能识别出是不同的物体。 2)物体是否发生形变：比如人在

15、运动过程中手臂和腿的变化。 3)多视角问题：从高空和从近处看到的同一目标有很大差异。 4)遮挡问题：由于目标的自遮挡和目标间的相互遮挡，只能得到目标的局部因而不能对目标准确判断识别。 5)同类目标类内差异：同类目标可能会有不同的外观。本文的图像识别工作主要是在 Pascal VOC2007 训练集和测试集下完成的，通过融合了图像多分割，集成图像的区域邻域信息，空间特征以及条件随机场全局优化等关键技术，对行人，飞机，自行车，猫，狗等 21 类目标进行训练和分析，取得了较好的识别结果。华中科技大学硕士学位论文华中科技大学硕士学位论文 2 1.2 国内外研究现状国内外研究现状近年来关于图像识别的研究取得了较大的进展，但是准确理解图像的内容仍然是一个难点问题，而该问题已经成为了计算机视觉领域中难点问题2,3。图像内容的理解的主要内容是分析场景中目标的类别及位置，其面对的主要困难是图像的低分辨率以及遮挡，多视角等等问题造成的，而当图像中出现多个目标时更具有挑战性。当前图像解析的一个基本方法就是结合图像的低级特征，比如颜色，纹理等，该方法已经取得了一定的研究成果，但是在识别率上还有很大可改进的空间。我们结合上下文以及条件随机场等方法对场景识别等工作进行优化处理，在一定程度上提高了目标识别的准确率。最

展开阅读全文

基于空间邻域词袋模型的图像标注技术

最新文档