《分布式图像检索训练系统的设计与实现》由会员分享,可在线阅读,更多相关《分布式图像检索训练系统的设计与实现(69页珍藏版)》请在金锄头文库上搜索。
1、 电 子 科 技 大 学 UNIVERSITY OF ELECTRONIC SCIENCE AND TECHNOLOGY OF CHINA 专业学位硕士学位论文 MASTER THESIS FOR PROFESSIONAL DEGREE 论文题目 分布式图像检索训练系统的设计与实现分布式图像检索训练系统的设计与实现 专业学位类别 软件工程软件工程 学 号 201122230115201122230115 作 者 姓 名 邹浩邹浩 指 导 教 师 段段翰聪翰聪 副副教授教授 分类号 密级 UDC注1 学 位 论 文 分布式图像检索训练系统设计与实现分布式图像检索训练系统设计与实现 (题名和副题名
2、) 邹浩 (作者姓名) 指导教师 段翰聪 副教授 成都 电子科技大学 (姓名、职称、单位名称) 申请学位级别 硕士 专业学位类别 软件工程 工程领域名称 软件工程 提交论文日期2014 年 3 月 论文答辩日期 2014 年 4 月 学位授予单位和日期 电子科技大学 2014 年 6 月 答辩委员会主席 评阅人 注 1:注明国际十进分类法 UDC的类号。 DESIGN AND IMPLEMENTATION OF DISTRIBUTED IMAGE RETRIEVAL SYSTEM A Master Thesis Submitted to University of Electronic Sci
3、ence and Technology of China Major: Software Engineering Author: Zou Hao Advisor: Hancong Duan School : School of Information and Software Engineering 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中
4、作了明确的说明并表示谢意。 作者签名: 日期: 年 月 日 论文使用授权 本学位论文作者完全了解电子科技大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 (保密的学位论文在解密后应遵守此规定) 作者签名: 导师签名: 日期: 年 月 日摘 要 I 摘 要 近年来, 随着视觉类感知推荐模式的推出, 基于内容的图像检索 (Content Based Image Retrieval, CBIR)应用越来越广泛,同
5、时对图像训练和检索的效率要求也越来越高。因此,针对传统的图像训练和检索技术在应对海量图像处理时的不足,更灵活的图像训练方式和更高精确度的图像检索方法是当下研究热点的问题。 本文提出了一种可支持增量训练的二进制子串二级索引方法 (Two-Level Index Based On Binary Substring,TLI) ,并在此基础之上设计实现了分布式图像训练检索系统。 图像训练时系统先使用 BRISK 算法提取图像特征向量,然后对特征向量按自然数递增序列进行唯一编号,再使用特定的资源映射规则,将特征向量散列到各分布式存储计算节点上,这种处理方法不仅可使得存储和计算负载相对比较均衡,而且具有较
6、好的扩展性。 系统的图像检索过程融合 MapReduce 计算模型,图像检索过程分为特征向量子串和图像特征点两个层面的归并,特征向量子串归并可得出相似特征向量候选集合,相似特征点归并就能得到相似的图像集合。同时,结合图像特征向量存储机制,每个计算节点的归并操作只需在本地进行,各计算节点间不存在网络通信。 文中测试部分首先将 TLI 与当前主流的高维向量索引算法:局部敏感哈希(Locality Sensitive Hash,LSH) 、词汇树(Vocabulary Tree,VT)方案进行了对比测试。然后就本文实现的分布式图像训练系统与一种基于多子树的分布式词汇树图像训练检索系统作性能比较。测试
7、表明,TLI 与 VT 在检索精度上比较相近,比LSH 高出 5%-10%,分布式 TLI 的检索时间也随着计算节点的增加逐步接近分布式 VT,相比 VT,TLI 最大的优势在于它可支持图像增量训练,更适用于互联网这种图像集快速增长的应用场景。 本文的创新点: 1. 基于二进制描述符子串划分理论提出了一种二进制子串二级索引方法, 解决了海明空间的 KNN 和范围查询问题. 2. 基于子串二级索引方法设计并实现了分布式图像训练系统, 系统可支持图像增量训练,同时能应对大规模图像的高精度检索 关键字:分布式图像检索,图像增量训练,海明范围查询ABSTRACT II ABSTRACT With th
8、e launch of recommended models for vision perception in recent years, Content Based Image Retrieval (CBIR) has been applied well, and efficiency in image training and image retrieval is inevitably highly demanded. Therefore, as to the shortcomings which the traditional image training and retrieval m
9、ethods have to face up when coping with mass images, more flexible image training and more accurate image retrieval approaches become a hot research problem. This thesis presents a Two-Level Index Based on Binary Substring (TLI) supporting the image incrementation training, by virtue of which a dist
10、ributed image training and retrieval system is designed and finally implemented. The image training process first extracts the binary descriptors of image by means of BRISK algorithm and identifies them by unique natural number in ascending order, then hashes those binary descriptors respectively in
11、to where the distributed computing nodes are through particular resource mapping rules. This processing method not only contributes balancing the storage and computing load, also providing high ability in expansion. The highlight of this method lies in the suppuration of image incrementation trainin
12、g, which makes images in trainSet be increased and deleted dynamically, while keeps the training outcomes of other images from being affected. The computational model MapReduce is melted in to the process of image retrieval which has two reducing levels. One is the substring processing for binary de
13、scriptor, from which a candidate set of feature-similar descriptors would be obtained. The other is the image features point reducing through which process a set of similar images is got. Meanwhile, the reducing process is combined with image features vector storage system, therefore, computing node
14、s only need localized running and there exists no network communication among these nodes so as to improve the degree of parallelism of image computing. In the final testing part, a comparison testing is operated among TLI proposed in this article and current mainstream high-dimensional descriptor i
15、ndex algorithms such as Locality Sensitive Hash (LSH) and Vocabulary Tree (VT). In the following, a performance comparison is run between the distributed image retrieval system ABSTRACT III implemented in this article and the distributed vocabulary tree training system implemented in the laboratory project Mobile Augmented Reality, and the testing result tells that both TLT and