基于综合概率函数和相关反馈的图像检索-开题报告大学论文.doc

资源描述

《基于综合概率函数和相关反馈的图像检索-开题报告大学论文.doc》由会员分享，可在线阅读，更多相关《基于综合概率函数和相关反馈的图像检索-开题报告大学论文.doc（13页珍藏版）》请在金锄头文库上搜索。

1、8基于内容的商标检索技术（开题报告）基于内容的商标检索技术摘要：随着我国经济的迅速发展，商标图像不断增加，传统的基于分类码和文本的商标检索技术由于效率不高以及对特征标注的繁琐等缺点已经逐渐落后于人们对于商标检索的性能需求，基于内容的图形检索技术日益成为人们研究的热点。本文将结合前人研究的内容，首先对基于内容的商标检索技术进行介绍和分析，然后将人工神经网络与深度学习算法进行结合，运用AUTO-ENCODER算法通过深度信念网络训练图形特征，然后运用训练出来的特征通过BP神经网络对图形进行检索，得出结果，并对结果进行误差分析。最后对改进深度学习神经网络模型提出自己的建议。关键词：商标检索；基于内容

2、；神经网络；深度学习 1 研究背景商标是商品的生产者、经营者在其生产、制造、加工、拣选或者经销的商品上或者服务的提供者在其提供的服务上采用的，用于区别商品或服务来源的，由文字、图形、字母、数字、三维标志、声音、颜色组合，或上述要素的组合，具有显著特征的标志，是现代经济的产物。在商业领域而言，商标包括文字、图形、字母、数字、三维标志和颜色组合，以及上述要素的组合，均可作为商标申请注册。经国家核准注册的商标为“注册商标”，受法律保护。商标通过确保商标注册人享有用以标明商品或服务，或者许可他人使用以获取报酬的专用权，而使商标注册人受到保护。我国商标注册申请量、审查量和有效注册商标量均位居世界第一，成

3、为世界第一商标大国。因此，高效、准确地从商标库中检索出潜在的近似商标成为一个重要研究方向1。商标作为一种特殊的并且具有商业价值和法律效力的图片，为了凸显它的价值，应该具有外形唯一性。因此应当避免申请注册商标和已注册商标相似。为了避免与已经注册的商标相似，需要在商标注册之前对已注册的商标进行检索1。传统的商标检索的那种先通过人工对商标进行分类，再根据人工分配的分类码来检索商标图像的方法，既耗时又主观主义2，一般只能适用于几乎全用文本的商标，对于那种没有多少文本而是用图片为内容的商标，这种检索准确率很低。所以在商标检索过程中，如何探测现代用户需求，提供最能满足用户意图的个性化检索结果成为当前图像检

4、索技术中急需解决的课题。目前对人工智能与人工神经网络( Artificial Neural Network，简称ANN) 的研究已较为广泛，但将人工智能中的神经网络算法应用于个性化图像搜索的相关研究还十分有限，在国内外关于个性化检索的研究中，应用深度学习神经网络算法进行检索结果个性化处理的研究较少，分析原因主要是由于深度学习神经网络对计算的硬件要求极高，运算速度较慢，实现困难。近年来，随着云计算技术的发展和神经网络专业硬件设备的开发，使利用深度学习神经网络算法提供个性化智能检索成为具有实践性和创新性的研究方向。本文以深度学习神经网络算法(Deep Learning) 为基础构建个性化图像检索模

5、型，在应用过程中实现动态学习和动态跟踪，且泛化( 或推广) 能力强，为用户提供更符合其目标的检索结果。2文献综述2.1传统的商标检索技术商标图像的检索方法众多，传统的商标检索方法按照检索的机理不同来划分，主要包括两种：基于文本标注的商标检索和基于分类的商标检索2。下面分别对这两种技术进行介绍。2.2.1基于文本的商标检索技术基于文本的商标图像检索沿用了传统文本检索技术，回避对图像可视化元素的分析，而是从图像名称、图像尺寸、压缩类型、作者、年代等方面标引图像，一般以关键词形式的提问查询图像，或者是根据等级目录的形式浏览查找特定类目下的图像，如Getty AAT使用近133,000个术语来描述艺术

6、、艺术史、建筑以及其它文化方面的对象，并推出30多个等级目录，从7方面描述图像的概念、物理属性、类型和刊号等。又如Gograph将图像分为动态图像、照片、图标、背景、艺术剪辑图、插图、壁纸、界面、成套图像8个一级类，下设数量不等的子类。在图像数字化之前，档案管理者、图书管理员都是采用这种方式组织和管理图像。基于文本的商标图形检索典型的的操作方法是将我们想要的商标图像用某一种查询语言描述，检索的过程就是匹配标注和描述，然后将商标图形数据库中相似的图像返回。目前广泛使用的如Google，百度的图片搜索就是应用的这种模式。2.2.2基于分类的商标检索技术目前,基于分类的商标检索技术是实践中使用最为普

7、遍的方式之一,通过等级式分类目录对不同行业不同领域的商标进行分类和组织,并提供基于分类的浏览查找。著名的商标国际分类通用标准有有关商标注册用商品和服务国际分类的尼斯协定(简称尼斯协定,Nice Classification)3,我国在1988年以前采用的是国内分类法,自1988年11月开始采用尼斯国际分类。尼斯分类包括45个大类,其中商品34类,服务项目11类,共包含一万多个商品和服务项目。同时为了对包括图形要素的商标建立分类,另有建立商标图形要素国际分类的维也纳协定(简称维也纳协定,Vienna Classification)4,用于对图形要素进行编码分类显示,该分类由商标图形要素按大类、小

8、类及组分类的一览表组成,并根据情况加以注释。2.2.3传统商标检索技术的缺点（1）基于文本的商标检索技术的缺点由于对商标图像的标注的深度不够和查询方式的单一，基于文本的商标检索技术就不能达到很好的效果，无法令人真正满意，用户需要在返回的很多商标中一个个再次查找，导致检索的效率不高，这些问题的出现使得基于文本的商标检索的应用出现障碍，从而促进了基于内容的商标检索技术的发展。（2）基于分类的商标检索技术的缺点基于分类的商标检索方法大量依赖人工处理，面对日益增加的大量待注册商标，分类和标记太慢；分类方法一旦确定后，就难以更改，对于大家制定的标准中出现的不合理的地方很难去修改，也很难在分类标准中更新标

9、准，因为这样做的话需要对重新分类已有的所有图像。由于以上原因，传统的商标检索技术已经日益落后于人们对于商标检索的需求，而基于内容的商标检索技术日益成为人们研究的热点。2.2基于内容的商标检索技术基于内容的图像检索技术，即CBIR5(Content-based image retrieval)，是计算机视觉领域中关注大规模数字图像内容检索的研究分支。典型的CBIR系统，允许用户输入一张图片，查找具有相同或相似内容的其他图片。而商标检索技术是这些技术的应用方向之一。T.Kato在1992年提出基于内容的图像检索技术这一概念。他构建了一个基于色彩与形状的图像数据库，然后提供了一定的检索功能进行实验。

10、此后，基于图像特征提取以实现图像检索的过程以及CBIR这一概念，被广泛应用于各种研究领域，如统计学、模式识别、信号处理和计算机视觉。目前，该技术已成功应用于人脸识别技术；针对商标与设计专利类的图像进行检索，防止专利纠纷的产生。因为图像的信息量一般要大于纯粹的文本信息，所以基于内容的图像检索在检索的速度和效率上要求更高。目前已有不少应用于实践环境的基于内容图像检索系统，如由IBM公司开发的最早商业化QBIC系统，以及由哥伦比亚大学研发的WebSeek系统、麻省理工学院研发的Photobook系统等5。2.3基于内容的商标检索技术现状和分析商标图像特征一般包括颜色、形状以及版面等特征，与其它图像相

11、比，作为人工图像的商标图像，其形状特征较颜色特征更为显著，而且许多商标图像属于单色无纹理的二值图像，因此一般利用形状特征进行检索，而形状特征的表达必须以对图像中物体或区域的划分为基础。对于一般的图像，当前的技术无法做到准确而鲁棒的自动图像分割，对于商标图像，其包含的物体或区域可以直接获得，所以形状特征能很好地应用于商标图像检索。为方便对图像进行形状特征提取。先将商标图像转换成二值商标图像。二值商标图像仅仅由白色和黑色两种像素组成，本文默认黑色为目标像素，白色为背景像素。基于内容的图像检索方法，就是指先提取出图像中物体的颜色、形状、纹理等图像特征，以及这些特征的组合，再生成特征向量，用特征向量来

12、表征图像内容，通过对特征向量进行相似性度量，来查询检索图像的方法。从定义就可以知道，基于内容的图像检索技术的关键就是特征提取和匹配，主要包括：图像的特征提取、相似性度量和相关性反馈等方面6。2.3.1 国外基于内容的商标检索技术现状QBIC5(Query By Image Content)是IBM公司的推出的世界上第一个商业化的基于内容的图像检索系统，它的出现对后来的图像检索技术发展有着深远的影响。T.Kato在1992年提出这一概念。他构建了一个基于色彩与形状的图像数据库，然后提供了一定的检索功能进行实验。此后，基于图像特征提取以实现图像检索的过程以及CBIR这一概念，被广泛应用于各种研究领

13、域，如统计学、模式识别、信号处理和计算机视觉。目前，该技术已成功应用于人脸识别技术；针对商标与设计专利类的图像进行检索，防止专利纠纷的产生。STAR7( System for Trademark Archival and Retrieval )是由新加坡国立大学开发的商标图像检索系统，它结合颜色和形状特征，而且同时使用了商标图像的三种主要的特征，商标形状和结构、商标文字和商标含义，而不同于其它的系统通常只采用图像的形状特征，使得在计算图像相似性时的判断更加灵活。主要采用基于边界的Fourier描述子、不变矩和研究比较成熟的灰度投影这些商标图像的形状特征来描述，而且使用多特征融合可以提取商标图像

14、不同侧重的特征点，实际上起到了取长补短的作用。系统还支持相关反馈来提取商标图像中的重要部分，将这些部分从图像中分割出来，然后通过计算并存储这些部分的形状特征，并将它们分类为既定的类别中的一个或多个，这种方法能够反映整个商标图像的整体形状。除此之外，STAR系统采用一种基于词典的模糊辞典技术。2.3.2 国内基于内容的商标检索技术现状我国在1988 年以前采用的是国内分类法, 自1988 年11 月开始采用尼斯国际分类。尼斯分类包括45 个大类, 其中商品34 类, 服务项目11 类, 共包含一万多个商品和服务项目。同时为了对包括图形要素的商标建立分类, 另有建立商标图形要素国际分类的维也纳协定

15、( 简称维也纳协定, Vienna Classification)4, 用于对图形要素进行编码分类显示, 该分类由商标图形要素按大类、小类及组分类的一览表组成, 并根据情况加以注释。MIRES11是中科院计算所智能信息处理重点实验室，在国家863计划支持下研制的，可以完成示例图像、关键词或两种模式交互混合三种方式的检索，允许用户设置各种特征的权重因子，支持相关反馈。在MIRES系统中，用户在客户端可以上传检索样本图像，也可以提供样本图像的语义关键词，对于专业用户还可以设置一些重要参数和对结果进行相关反馈。MIRES系统在服务器端的工作，主要是接收用户上传的检索要求，通过对数据和参数进行分析，来

16、选择最佳的查询策略，并启动相应的检索引擎，进行检索。最后将查询结果按照图像的相似度降序排列后返回给用户。另外MIRES系统还提供了分布式的系统运行平台，使用户和服务器有着更好的通信方式。清华大学的基于Internet上静态图像的CBIR的原型系统，不仅能很快的检索Internet上大量数据，而且具有较好的检索效果。2.4商标图像预处理传统图像预处理方法没有对图像进行分析，忽略了某些总体信息（例如是否符合图像中物体的轮廓）另外传统方法几乎无法对有小部分损坏或者遮挡的图片进行恢复。深度学习的概念由Hinton等人于2006年提出。基于深信度网(DBN)提出非监督贪心逐层训练算法，为解决深层结构相关的优化难题带来希望，随后提出多层自动编码器深层结构。此外Lecun等人提出的卷积神经网络是第一个真正多层结构学习算法，它利用空间相对关系减少参数数目以提高训

展开阅读全文