Web中图像的检索技术研究

上传人:lizhe****0001 文档编号:54559699 上传时间:2018-09-14 格式:PPT 页数:19 大小:125.50KB
返回 下载 相关 举报
Web中图像的检索技术研究_第1页
第1页 / 共19页
Web中图像的检索技术研究_第2页
第2页 / 共19页
Web中图像的检索技术研究_第3页
第3页 / 共19页
Web中图像的检索技术研究_第4页
第4页 / 共19页
Web中图像的检索技术研究_第5页
第5页 / 共19页
点击查看更多>>
资源描述

《Web中图像的检索技术研究》由会员分享,可在线阅读,更多相关《Web中图像的检索技术研究(19页珍藏版)》请在金锄头文库上搜索。

1、Web中图像的检索技术研究,作 者:刘晓流通指导老师:张 量2004.6.10,摘 要,随着网络技术和计算机技术的飞速发展,网络搜索技术越来越受到人们的重视。如今,虽然网络检索技术已走向成熟和完善,但还是不能满足人们的需求。在本文,我首先要向大家介绍一般网络搜索技术的基本原理、发展现状和它的发展趋势。在第二章我们则讲述基于Web的图像检索技术,解析搜索过程中分词技术的应用、检索模型和相似度他们之间的具体关系。,上一张,本文来自无忧毕设网 联系QQ: 375279829,引 言,研究现状:随着网络传送速度与计算机信息处理速度的提高,网页中对多媒体信息的使用变得十分普及,特别是图像信息,己经成为表

2、示网页内容不可缺少的组成部分。因此人们对多媒体信息的检索需求也就随之随之变得特别迫切。但由于图像检索系统涉及了多学科的知识,实现和应用的难度相当高,所以已有的图像检索系统都有这样或那样的缺陷。 而传统的信息检索主要集中于文字的检索,在多媒体方面的研究并不是很多。互联网上的多媒体以图像为主,因此图像的检索就成为了目前研究的热点。 图像检索经历了两个阶段:第一阶段是以文本为基础的检索。第二阶段是以图像自身的内容为基础的检索。,上一张,引 言,发展趋势立足于文本,对图像进行检索。试图将传统的文本检索技术移植于对多媒体信息的检索上 立足于图像内容,对图像进行分析和检索。 结合文本和内容,进行融合性研究

3、。发挥各自的优势促进图像的高效、简单检索方式的实现,上一张,引 言,存在的问题: 由于搜索引擎技术的开发牵涉到信息检索、人工智能等许多基础研究领域的理论和技术,中文搜索引擎的开发就更涉及到语言习惯的差异、智能切分词等棘手的问题,而且中文搜索引擎技术的起步也较晚,还远没能满足中国网民的需求。因此我们现在要做的是研究出适合中国大众的简单有效的搜索技术。,上一张,基于Web的图象搜索,引擎的搜索途径 :1. 关键词检索(1)基于图像外部信息进行检索(2) 基于手工标注的检索2.图象可视属性的检索,上一张,基于Web的图象搜索,文本图像间关系在文本检索中,搜索引擎主要考虑Web页中相关文字信息以及它的

4、语义,这些文本信息反映出网页的内容,但不完全与网页中图片的内容一致。在HTML网页中,根据HTML语言的格式,捕获反映图片信息的文字信息,分析这些文本的语义具有重要的意义。,上一张,基于Web的图象搜索,图像的文本标记 (1)图像的说明 :图像说明文本(2)图像的标题 :图像关键词(3)图像的标签 :说明图片摘要信息的短语 (4)网页的标题 :反映网页中心内容,上一张,基于Web的图象搜索,文本权值间的关系在图像的检索中,首先是要建立描述图片内容特征的查询语句,然后比较、区分它们之间的异同,获取需要检索的图像。但它们对图像描述时侧重不同,同时与图像信息的联系程度也不同。如图像标题和网页标题是简

5、单的词条,两者中相对来说图像标题更接近图像的主题内容。所以在比较、区分各类文本信息以决定是否符合检索要求时,它们所占的权值应该是有所不同的。根据信息的重要程度,他们所占的权值大小按次序如下:Image CaptionImage TitleImage AlternatePage Title,上一张,基于Web的图象搜索,图像检索模型Web搜索引擎采用何种检索模型,它所提供检索质量将直接影响到检索的效果。这里采用向量空间模型。,上一张,基于Web的图象搜索,向量模型中权值计算在这里我们一般采用比较简单的统计法来计算它的权值。公式如下:在信息检索中常用的词条权值计算方法为 TF-IDF 函数:,上一

6、张,基于Web的图象搜索,相似度算法两文档di,dj之间的相似度可以用其对应的向量之间的夹角余弦来表示:,上一张,基于Web的图象搜索,进行查询的过程中,先将查询条件Q进行向量化,主要依据布尔模型:当ti在查询条件Q中时,将对应的第i坐标置为1,否则置为0,即也就是说当两词条完全相同时,这一项为1,其余情况为0。可以看出文档含有完全相同的词条时,相似度=1;而其中无相同时的词条时,相似度=0。,上一张,基于Web的图象搜索,从而文档d与查询Q的相似度为:根据文档之间的相似度在查询过程中,可以计算出每个文档与查询的相似度,进而可以根据相似度的大小,将查询的结果进行排序。,上一张,基于Web的图象

7、搜索,分词技术和匹配方法1. 常用的切词算法如下:(1)最大正向匹配法 (2)逆向最大匹配法 (3)基于词频的统计方法 由于这些设计思想都不怎么好,所以这里我们将提出改良的匹配法。,上一张,基于Web的图象搜索,词典存储格式:第一层存储所有单字,第二层保存所有的双字词和多字词的前两个字,第三层存储以某一双字为首的所有词。,上一张,基于Web的图象搜索,匹配方法假设对一个句子C1C2进行分词处理,算法描述如下:1) 两个字(开始时为C1C2),在词典中查询C1C2是否存在2) 不存在,则C1为单字词,一次分词结束,返回1。3) 存在,判断C1C2是否为词,并从词典中获取该词下层节点汉字的最大长度

8、,设为n4) 若n=0,一次分词结束,保存结果。5) 否则,i=2,转6)。6 ) i=i+1,若i=n+3,转8);否则,转7)。7) 再取一个字(此处为Ci),判断第三层中是否有以C3Ci开始的字(不需要恰好匹配,只要匹配开始的i个字就可以了)。8) 若存在,分词结束,返回最近一次能够恰好匹配的C3Cj(j80%,而检索完全度60%。,上一张,本文来自无忧毕设网 联系QQ: 375279829,在了解了搜索引擎的搜索原理公式和反馈原理之后,我们可以根据其理论做出相应的搜索引擎,并能作出比较搜索效果。但为了能更好的使用,还得去仔细更好的给文档进行分类,更多的对此引擎进行反馈训练查询等,使得Web搜索引擎具有更好的智能性和个性化的特点。,上一张,结束,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 教育/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号