毕业论文——Web中图像的检索技术研究 (2)

上传人:wo7****35 文档编号:60510164 上传时间:2018-11-16 格式:DOC 页数:13 大小:208.50KB
返回 下载 相关 举报
毕业论文——Web中图像的检索技术研究 (2)_第1页
第1页 / 共13页
毕业论文——Web中图像的检索技术研究 (2)_第2页
第2页 / 共13页
毕业论文——Web中图像的检索技术研究 (2)_第3页
第3页 / 共13页
毕业论文——Web中图像的检索技术研究 (2)_第4页
第4页 / 共13页
毕业论文——Web中图像的检索技术研究 (2)_第5页
第5页 / 共13页
亲,该文档总共13页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《毕业论文——Web中图像的检索技术研究 (2)》由会员分享,可在线阅读,更多相关《毕业论文——Web中图像的检索技术研究 (2)(13页珍藏版)》请在金锄头文库上搜索。

1、摘 要在网络和多媒体技术越来越发达的今天,信息检索技术成了现在计算机领域的重要内容,而图像检索技术又正是这其中的重要内容之一。而网络资源的极大丰富以及图像检索技术不断发展成熟,使得图像检索技术的应用领域不断扩大,这为图像检索技术的继续研究提供条件。人们为了对图像进行更好的使用和组织管理,便开发出了多种多样图像检索技术,本文首先要将各种图像检索技术的工作原理、研究现状、相关图像搜索引擎与发展趋势作一个介绍。随着网络传送速度与计算机信息处理速度的提高,网页中对多媒体信息的使用变得十分普及,特别是图像信息,己经成为表示网页内容不可缺少的组成部分。在实现对网页中文本信息提取的同时,如何再为用户抽取所需

2、的图片资料,是信息检索中一个重要的方面。于是各种基于Web的图像检索系统应运而生。它们采用不同的工作方式,极大地方便了用户对网上图像进行检索。目前图像检索技术的发展正走向更加成熟和完善,其中Web图像搜索技术也更加完善,本文将介绍这种图像检索技术并阐述Web页中的图像与文本之间的关系,对相似度作出了详细的论述。关键字: 搜索引擎 图象检索 文本处理 信息检索 相似度 相关性反馈 Study of Web Images Retrieval TechniqueAbstractToday, the network and multimedia technology are more and more

3、 developed, retrieval technique of information has become the important content of the computer field now, and picture retrieval technique is exactly one of the important contents among them. And network resources are enriched greatly and picture retrieval technique is developing ripe constantly, ma

4、ke picture application of retrieval technique expand constantly, this offer terms for picture continuation research of retrieval technique.People develop varied picture retrieval technique in order to carry on better use and organizational management to the picture , this text should first act as an

5、 introduction various kinds of picture operation principle , research current situation , relevant picture search engine and development trend of retrieval technique.With the improvement of the transfer rate of the network and information processing speeds of the computer, it is popularized very muc

6、h that the webpage hits the use for information of the multimedia, especially the information of the picture , it shows the component with indispensable content of the webpage that own but become. While realizing drawing the Chinese version information of the webpage, how to collect the necessary pi

7、cture materials for users again, it is an important respect in information retrieval. Then various kinds of picture retrieval systems based on Web arise at the historic moment. They adopt different working way, help user search to the picture online greatly.The development of retrieval technique of

8、the picture is moving towards riper and more perfect at present, Web picture too perfect to search for technology among them, this text recommend the picture retrieval technique and explain Web picture and relation of text of page, make detailed argumentation to similar degree ,etc. , search for thr

9、ough experiment model conclusion indicate the high efficiency that the picture searches for.Keywords: Search engine Image Retrieval Text-processing Information retrieval Similar degree Dependence feedback第一章 前言1.1引言随着多媒体技术及 Internet网络的迅速发展,图像来源不断扩大,大容量高速存储系统为图像的海量存储提供了基本保障,各行各业对图像的使用越来越多,图像信息资源的管理和检

10、索也就显得越来越重要。但由于Internet 本身结构上、管理上的问题,想要在Internet 准确、快速、全面地找到自己所想要的图像,却变成了件非常不容易的事。由于Internet现有的问题:内容没有结构;网上信息量庞大且还在不断的增加。因此,网络产生了搜索引擎。虽然这些给网络用户提供了不少的帮助,但由于但离准确、快速、全面地搜索自己所要的图像还相当遥远,所以对图像检索还要作很大的研究。根据国内外现有的搜索引擎和国际上的有关研究小组的种种资料表明,现有的网络资源和搜索引擎有如下特点:(1)索引的数据种类丰富,如文字、图像、声音等多媒体。数据的存取协议也是多种多样的,如HTTP、FTP、New

11、s、Gopher等;(2)索引数据量大,以致不可能有某个数据库能包括整个Internet的索引,目前最大的搜索引擎,其中的索引也只不过覆盖了Internet的一小部分;(3)资源消耗太大,系统需要将HTML文件传送至本地然后分析,大量占用昂贵的网络带宽和CPU资源,增加被搜索结点的负担。另外由于现有的搜索引擎一般是集中式的,所以搜索引擎服务器本身的硬件配置也极高,才能处理庞大的数据量和及时地响应用户的查询请求;(4)不能有效解决索引失效问题,很多时候,搜索引擎会返回无效的查询结果;(5)各检索工具各行其事,不能相互协作,在一定意义上讲是一种资源的浪费。1.2现有的图像检索技术近年来随着用户对网

12、上图像搜索要求的不断增长,各种图像搜索引擎应运而生,它们各自以不同的工作方式为用户提供各种检索途径,使网上图像信息的搜索变得非常简单,尽管还不很完善,却已经可以满足用户的大多数要求。1.2.1搜索引擎的工作原理最基本的搜索引擎的结构,是由Spider不停地从Web网上收集数据,存放在搜索引擎的数据库中。用户通过搜索引擎服务器上的Web接口,提出搜索请求,Web Server通过CGI或其它技术访问数据库,并将用户的搜索请求转换成相应的数据存取语句,送给数据库引擎处理,并把查询结果通过网页显示给用户。网络搜索的基本原理是通过网络机器人定期在web网页上爬行,然后发现新的网页,把它们取回来放到本地

13、的数据库中,用户的查询请求可以通过查询本地的数据库来得到。一般来说网络信息检索的实现机制一般有两种,一种是通过手工方式对网页进行索引,它的缺点是Web的覆盖率比较低,同时不能保证最新的信息。查询匹配是通过用户写入的关键字和网页的描述和标题来进行匹配,而不是通过全文的匹配进行的。第二种是对网页进行自动的索引,这种能实现自动的文档分类,实际上采用了信息提取的技术。但是在分类准确性上可能不如手工分类。在现在所有运行的搜索工具来说,一般都有一个Robot定期的访问一些站点,来检查这些站点的变化,同时查找新的站点。一般站点有一个robot.txt文件用来说明服务器不希望Robot访问的区域,Robot

14、都必须遵守这个规定。如果是自动索引的话,Robot在得到页面以后,需要对该页面根据其内容进行索引,根据它的关键字的情况把它归到某一类中。页面的信息是通过元数据的形式保存的,典型的元数据包括标题、IP地址、一个该页面的简要的介绍,关键字或者是索引短语、文件的大小和最后的更新的日期。尽管元数据有一定的标准,但是很多站点都采用自己的模板。文档提取机制和索引策略对Web搜索引擎的有效性有很大的关系。高级的搜索选项一般包括:布尔方法或者是短语匹配和自然语言处理。一个查询所产生的结果按照提取机制被分成不同的等级提交给用户。最相关的放在最前面。每一个提取出来的文档的元数据被显示给用户。同时包括该文档所在的U

15、RL地址。另外有一些关于某一个主题的专门的引擎,它们只对某一个主题的内容进行搜索和处理,这样信息的取全率和精度相对就比较高。 目前,图像搜索引擎主要通过以下两种方法识别图像: (1)自动查找图像文件。通过两个HTML标签,即IMGSRC和HREF来检测是否存在可显示的图像文件,IMGSRC表示“显示下面的图像文件”,导向的是嵌入式图像;而HREF则表示“下面是一个链接”,导向的是被链接的图像。搜索引擎通过检查文件扩展名来判断其导向的是否为图像文件,如果文件扩展名是.gif或.jpg,即是一个可显示的图像。 (2)人工干预找出图像。进行分类,由人工对网上的图像及站点进行选择。这种方法可以产生准确

16、的查询体系,但劳动强度太大,因此要限制处理图像的数量。由于图像不同于文本,需要人们按照各自的理解来说明其蕴含的意义,因此图像检索比文本的查询和匹配要困难得多。1.2.2 图像搜索引擎的检索途径1.关键词检索传统的图像检索技术是基于关键字的精确匹配检索,系统内的图像用关键字标识,检索线索是与标识相一致的关键字,即输入是关键字,输出是图像。它又包括两种途径:(1)基于图像外部信息进行检索。即根据图像的文件名或目录名、路径名、链路、ALT标签以及图像周围的文本信息等外部信息进行检索,这是目前图像搜索引擎采用最多的方法。在找出图像文件后,图像搜索引擎通过查看文件名或路径名确定文件内容,也可以通过查看图像的标题来匹配检索词。(2)基

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 毕业论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号