图像场景分类的关键技术研究

资源描述

《图像场景分类的关键技术研究》由会员分享，可在线阅读，更多相关《图像场景分类的关键技术研究（16页珍藏版）》请在金锄头文库上搜索。

1、题目编号题目编号 5 图像场景分类的关键技术研究图像场景分类的关键技术研究Research on Key TechnologiesFor Scene Classification学生姓名专业学号指导教师学院电子信息工程学院电子信息工程学院2012 年年 06 月月图像场景分类的关键技术研究图像场景分类的关键技术研究摘摘要要:图像场景可能由多个对象(比如:草地，马路，建筑物)所组成。给定一组图像，我们的目标是利用无监督方法发现每一幅图像所包含的对象，然后根据这些对象的分布实现场景的分类。潜在语义分析是由统计文本分析发展而来的产生式模型，它能够发现文档所包含的潜在主题。本文通过

2、研究不同的视觉词汇和潜在主题数目对场景分类性能的影响，我们选择单层 SIFT 特征作为 PLSA 的词汇表。然后在此基础上进行改进，实现多层SIFT 特征，多种特征融合作为词汇表。采用概率潜在语义分析(PLSA)对词汇表进行分析，实现图像中潜在对象的发现；图像被比作成一篇由若干“视觉词包”所组成的文档，图像中的对象则被看成该图像文档所包含的潜在主题。这样，利用 PLSA 就可以发现图像中潜在对象的概率分布。基于对象概率分布的场景分类则由 K-最近邻分类器来完成的。实验表明，结合 PLSA 和 KNN 的分类方法提出的基于多层 SIFT 特征和多种特征融合的 PLSA 模型可获得比单层 SIFT

3、特征更加理想的场景分类效果关键词关键词:概率潜在语义分析(PLSA)，场景分类，SIFT 特征，颜色特征，边缘特征，多层 SIFT 特征 Research on Key TechnologiesFor Scene ClassificationABSTRACT: Given a set of images of scenes containing multiple categories (e.g. grass, roads, buildings) our objective is to discover these objects in each image in an unsupervised

4、 manner, and to use this object distribution to perform scene classification. We investigate the classification performance under changes in the visual vocabulary and number of latent topics learnt, and develop a novel vocabulary using SIFT descriptors. Then based on this method, we developed vocabu

5、lary using multi-level SIFT descriptors in order to improve the classification performance. Finally Using a variety of features generate vocabulary, we achieve this discovery using probabilistic Latent Semantic Analysis (PLSA), a generative model from the statistical text literature, here applied to

6、 a bag of visual words representation for each time image. The scene classification on the object distribution is carried out by a k- nearest neighbor classifier. In all cases the Scene Classification Based on Multi-level SIFT and Multi-feature for the combination of PLSA followed by (supervised) K-

7、 nearest neighbor classification achieves more superior results.Keywords： PLSA, Scene classification, SIFT characteristic, multi-level SIFT characteristic 目目录录第一章第一章引引言言.- 1 -1.1 本文研究目的 .- 1 - 1.2 本文研究意义 .- 2 - 1.3 本文研究工作 .- 4 - 1.4 本文的组织 .- 5 -第二章第二章场景分类的特征场景分类的特征.- 6 -2.1 颜色特征提取 .- 6 - 2.2 SIF

8、T 特征提取 .- 7 -第三章第三章基于基于 PLSA 模型的图像场景分类模型的图像场景分类 .- 9 -3.1 PLSA 的原理.- 9 - 3.2 PLSA 的优点.- 9 - 3.3 基于 PLSA 图像场景分类.- 10 - 3.3.1 图像与文本对应关系.- 10 - 3.3.2 图像场景分类过程.- 10 -第四章第四章结论及展望结论及展望.- 12 -参考文献参考文献.- 13 -长春理工大学论文- 1 -第一章第一章引引言言伴随着日益高速的数字化图像，基于内容的图像管理和检索变得越来越重要。将图像语义分类(例如:海洋，山脉，街道)和将图像分解成语义对象(例如:摩托车，

9、天空，飞机)是实现基于内容的图像管理和检索的有效方法，在如今成为一个非常具有挑战行的课题，这一章将描述论文的目的和动机，给出本文的贡献，最后给出本文的组织思路。1.1 本文研究目的本文研究目的论文的目标是，给定一组图像，通过图像中包含的场景或对象来对它们进行分类。图 1.1 表示了几种不同的场景。图 1.1 场景分类示例这里我们想区分多个图像类别，我们的目标就是实现一个图像分类系统，使得该系统具有很好的性能，分类器计算量少，并且较少的人工操作或者不用人工操作，我们不断在效率，监督，和性能上找出一个平衡，让该系统满足有效，高性能，无监督。进一步，随着图像类别的增多，仅仅使用图像一个特征(例如:形

10、状)来区分它们就变得越来越困难啦。例如:图像的形状特征可能在区分小轿车和飞机上表现的性能非常好，但是它不一定适合于区分马和斑马，我们的目的就是设计出长春理工大学论文- 2 -一个对多类图像进行分类也具有高效性。1.2 本文研究意义本文研究意义随着多媒体图像的迅猛增长，如何快速访问你想找的图像就变得尤为重要。基于内容的图像描述对组织和访问与日俱增的图像变得非常有用，图像的场景分类在很多领域有非常重要的应用：（1）图像检索:图像检索是场景分类的一个最直接应用，通过场景分类，我们可以利用图像搜索引擎比较快速的对世界上所有图像进行搜索，或者对个人计算机上的图像进行搜索。（2）医学应用:现在在医学领域，

11、每天也有很多图像产生，例如:X 光线图像，脑皮层电图，因此对一生来说提供一个系统让他们更加迅速的访问他们想访问的图像而不必去查询所有的图像。（3）旅游导航:伴随着交通的便利，出游的人与日俱增，代替传统每个省市县的纸质地图，我们拥有存储在移动电话的数字旅游导航地图，通过一幅该地图像来检索该地相关旅游信息。（4）机器人:在计算机视觉领域，如何给机器人提供眼睛是一件非常困难的事，如果能快速图像识别，那么机器人就能快速的代替人自动完成一些工作。自 2000 年至今，虽然许多图像分类方法被提出，但是分类性能对不同的数据库仍然不尽满意，这和对象识别领域一样，是计算机视觉中的一个非常有挑战性的课题。目前我们可以识别一棵树，不管这棵树是远还是近;但是对于同一棵树来说，不同的季节有不同的表现形式(冬天没有叶子，秋天有褐色的叶子，春天有绿色的叶子等)，对于一棵树来说我们可以考虑所有情况去识别它，但是对于其他很多对象来说，我们去自动识别它们仍然是一个巨大的挑战，现在让我们去讨论一下在设计一个完善的图像分类系统中要考虑那些方面: 光照的可变性:对于图像分类，一件非常重要

展开阅读全文