基于深度学习的特征表示与目标检索技术研究

上传人:开*** 文档编号:61839549 上传时间:2018-12-13 格式:DOCX 页数:75 大小:366.71KB
返回 下载 相关 举报
基于深度学习的特征表示与目标检索技术研究_第1页
第1页 / 共75页
基于深度学习的特征表示与目标检索技术研究_第2页
第2页 / 共75页
基于深度学习的特征表示与目标检索技术研究_第3页
第3页 / 共75页
亲,该文档总共75页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《基于深度学习的特征表示与目标检索技术研究》由会员分享,可在线阅读,更多相关《基于深度学习的特征表示与目标检索技术研究(75页珍藏版)》请在金锄头文库上搜索。

1、密级保密期限;遞耆部fAf硕士学位论文题目:基于深度学习的特征表示与目标检索技术研究学号:2014110046姓名:胡焜专 业:信息与通信工程 导师:董远学 院:信息与通信工程学院2016年 11月 27日中国北京保密期限:题目:基于深度学习的特征表示与 目标检索技术研究学 号:2014110046姓名:胡焜专 业:信息与通信工程 导师:董远学 院:信息与通信工程学院2016年 11月 27日硕士学位论文独创性(或创新性)声明本人声明所呈交的论文是本人在导师指导下进行的研宄工作及取得的研宄 成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不 包含其他人已经发表或撰写过的研宄

2、成果,也不包含为获得北京邮电大学或其他 教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研宄所做的任 何贡献均已在论文中作了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切相关责任。本人签名:戍日期:关于论文使用授权的说明本人完全了解并同意北京邮电大学有关保留、使用学位论文的规定,即:北 京邮电大学拥有以下关于学位论文的无偿使用权,具体包括:学校有权保留并向 国家有关部门或机构送交学位论文,有权允许学位论文被査阅和借阅;学校可以 公布学位论文的全部或部分内容,有权允许采用影印、缩印或其它复制手段保存、 汇编学位论文,将学位论文的全部或部分内容编入有关数据库进行检索

3、。(保密 的学位论文在解密后遵守此规定) 日期:基于深度学习的特征表示与目标检索技术研究摘要基于内容的图像检索技术一直是一个热门研宄方向,在如今互 联网络图片及视频资源呈现爆炸式增长的大背景下,CBIR技术能够 帮助人们更快更准确地获取到自己想要的信息。深度学习近几年非 常火热,强大的特征学习能力以及非线性特征表达能力,使得深度 学习在计算机视觉领域的多个分支都实现了突破。本文主要是研宄 基于深度学习的特征表示以及其在图像检索中的应用。一个有效的图像检索系统分为两个部分:一个是具备强大表征 能力的特征;一个是快速的检索过程。本文主要从这两个方面着手 研究。在特征提取方面,本文首先研究CNN中不

4、同层之间的表达能 力差异,然后提出一种多层次的池化方法以及多层特征融合的方 法,并采用PCA即LDA降维方法对特征进行过滤;在快速检索方 面,本文提出一种基于深度学习的哈希技术,用卷积神经网络同时 进行特征学习以及哈希函数学习。具体地,本文的主要工作概括如下:研究卷积神经网络中不同层的特征表达能力差异,并发现 相比于全连接层的特征而言,卷积通道特征对于图像检索 问题而言更为有效;提出一种多层次池化方法用于特征提取,将卷积图中的局 部区域特征与全图的全局特征融合在一起,使得特征更具 鲁棒性,在多个数据及上验证了其效果;提出一种多层特征融合的方法,通过结合低层的视觉特征 以及高层语义特征,提升了最

5、终特征的泛化能力,在多个 数据集上多层融合特征对于性能都有提升;提出一种区域感知的深度哈希技术,结合图像目标候选区 域提取算法,Rol pooling,多标签分类损失函数以及加权 三元组损失函数,使得网络能够同时进行特征学习以及哈 希函数学习。关键词:卷积神经网络,图像检索,多层次池化,深度哈希DEEP LEARNING BASEDFEATURE REPRESENTATION ANDOBJECT RETRIEVALABSTRACTContent-based image retrieval technology has always been a popular research directi

6、on. Nowadays, the CBIR technology can help people get the information they want more quickly and accurately, under the background of explosive growth of Internet pictures and video resources. Deep learning is very hot in recent years. Due to the Strong feature learning ability and nonlinear feature

7、representation ability, deep learning has achieved a huge improvement in computer vision. In this paper, we mainly study the feature representation based on deep learning and its application in image retrieval.An effective image retrieval system is divided into two parts: one is a powerful image rep

8、resentation; the other is a fast retrieval process. This paper focuses on these two aspects. In the aspect of feature extraction, this paper firstly studies the difference of expression ability between different layers in CNN, and then proposes a multi-level pooling method and multilayer feature fus

9、ion method, and finally filters the feature by using PCAor LDA dimensionality reduction method. In the aspect of fast retrieval, this paper proposes a hash algorithm based on deep learning, which combines feature learning and hash function learning with convolution neural network.In particular, the

10、main work of this paper is summarized as follows: The difference of feature representation in different layers of convolutional neural network is studied, and it is found that convolutional channel features are more effective for image retrieval compared with the feature of fully connected layer. A

11、multi-level pooling method is proposed for feature extraction, which combines the local features in the convolution feature maps with the global features of the whole map to make the feature more robust; A method of multi-level feature fusion is proposed, which improves the generalization ability of

12、 the final feature by combining the low-level visual features and the high-level semantic features. Experiments show that the multi-layer fusion method improves performance in multiple datasets. A region-aware deep hashing algorithm is proposed. Its composed of region proposals extraction algorithm,

13、 Rol pooling, multi-label classification loss function and weighted triple loss function, which enable the network to simultaneously learn feature representation and hash function.KEY WORDS: convolutional neural network, image retrieval, multi-level pooling, deep hashingiu.课题研究的背景与意义11.2. 国内外研究现状21.

14、3. 本文的工作内容与贡献41.3.1. 研宄内容41.3.2. 主要贡献51.3.3. 论文组织结构5第二章基于内容的图像检索技72.1. mt72.2. 基于传统特征的CBIR技术82.3.1. 传统特征-SIFT82.3.2. 局部聚合特征向量(VLAD) 92.3.3. Fisher Vector112.3. 基于深度学习的CBIR技术122.4.1. 预训练132.4.2. 全连接层特征132.4.3. 距离监督特征学习142.4.4. 新数据集上的模型微调162.4. 本章小结16第三聿基于卷积神经网络的特征表达173.1. 前言173.2. 卷积神经网络基础193.2.1. 数据

15、预处理及参数初始化193.2.2. 卷积、池化及全连接203.2.3. 非线性单元223.3. 常用CNN网络结构243.3.1. AlexNet243.3.2. VGGNet253.3.3. GoogleNet263.3.4. ResNet263.4. 多层次特征融合273.4.1. CNNs中的不同层283.4.2. 多层次池化方法303.4.3. 多层特征融合313.4.4. PCA及LDA特征降维与白化323.5.本章小结33第四章深度哈希关键技术354.1. 前言354.2. 候选区域提取技术364.2.1. Selective search364.2.2. RPN384.3.区域感知深度哈希技术394.3.1. Proposals 提取404.3.2. CNN子网络选择404.3.3. 多标签分类损失函数414.3.4. 哈希编码424.4. 本章小结 44第五章实验结果与分析455.1. 相关数据集及验证方法455.1.1. 数据集455.1.2. 验证方法465.2. 特征表达相关实验475.2.1. 多层次池化的有效性475.2.2. 多层特征融合的效果4

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号