人工智能技术在搜索引擎中的应用

上传人:博****1 文档编号:511610216 上传时间:2023-11-05 格式:DOCX 页数:10 大小:21.38KB
返回 下载 相关 举报
人工智能技术在搜索引擎中的应用_第1页
第1页 / 共10页
人工智能技术在搜索引擎中的应用_第2页
第2页 / 共10页
人工智能技术在搜索引擎中的应用_第3页
第3页 / 共10页
人工智能技术在搜索引擎中的应用_第4页
第4页 / 共10页
人工智能技术在搜索引擎中的应用_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《人工智能技术在搜索引擎中的应用》由会员分享,可在线阅读,更多相关《人工智能技术在搜索引擎中的应用(10页珍藏版)》请在金锄头文库上搜索。

1、人工智能技术在搜索引擎中的应用 摘要 文章介绍了搜索引擎的分类、工作原理以及体系结构。并且基于人工智能技术,对搜索引擎中运用的 人工智能技术进行了研究和分析。描述了搜索引擎发展的智能化方向与方法,对智能型搜索引擎所面临的 挑战以及未来发展进行了展望。文中对网络搜索引擎的搜索策略进行了分析,介绍了如何在网络中搜集和 发现信息,以及如何对信息进行理解、提取、组织和处理,并为用户提供检索服务。本文首先第一部分介 绍了搜索引擎技术,第二部分介绍了搜索引擎的工作原理,第三部分对人工智能技术及其在搜索引擎中的 应用进行 了研究。展望了搜索引擎中查询接口的智能化发展趋势,尤其是基于关键词匹配关搜索键技术词到

2、自 然语言查询,自然语言查询具有智能分词功能,使得查询变得更为简单、易于操作。 关键词 搜索引擎人工智能 智能代理自然语言查询abstractThe thesis illuminates the classification, the systemic structure of the searching engine, makes a research and analysis to the artificial intelligence technology which is applied to the searching engine. It also describes the in

3、telligent way of the development of the searching engine, the challenge to the intelligent searching engine and the prospect of the future development. In this article, it makes a analysis to the searching strategy of the searching engine in internet, explaining how to gather and find information, h

4、ow to understand, obtain, organize and deal with the information, meanwhile offering the consumer with the searching service. The thesis introduces the search engine technology in first part, the operating principles in the second part and studies the artificial intelligence technology and its appli

5、cation in the search engine in the third part. Prospect the trend of the intelligent development of search interfaces in the search engine, especially for natural language inquiry, which is based on keyword matching search technology and have intelligent divided-word function making the inquiry simp

6、ler and operation easier.keywordssearching engine artificial intelligence intelligent agencynatural language inquiry.1 引言2 搜索引擎技术 . 12.1 搜索引擎的分类 12.2 搜索引擎的工作原理与主要技术 23 人工智能技术及其在搜索引擎中的应用研究 . 33.1 智能代理技术 33.2 智能代理的优势 43.3 搜索引擎中的客户端智能代理和服务器端智能代理 43.4 搜索引擎中查询接口的智能化 44 结束语5 致谢6 参考文献人工智能技术在搜索引擎中的应用1引言近年来,

7、由于网络技术的飞速发展,网络成为信息发布和传输的重要方式。虽然网络上蕴藏着巨 大的信息资源,但是要想从这个信息海洋中准确快速地找到并获得自己所需的信息,往往比较困难。 为了解决这个问题,人们开始开发了各种检索工具。随着各种技术的日渐成熟,网络搜索引擎开始迅 速发展起来。然而由于搜索引擎的工作方式和网络的快速发展,其搜索的结果让人越来越不满意。这是由于搜 索引擎通过对网站的相关性来优化搜索结果,这种相关性又是由关键字在网站的位置、网站的名称、 标签等公式来决定的。这就是使搜索引擎搜索结果多而杂的原因。而搜索引擎中的数据库因为因特网 的发展变化也必然包含了死链接。本文介绍了搜索引擎技术,搜索引擎的

8、工作原理,并对人工智能技 术及其在搜索引擎中的应用进行了研究。2搜索引擎技术搜索引擎(search engines是对互联网上的信息资源进行搜集整理,然后供你查询的系统,它包 括信息搜集、信息整理和用户查询三部分。搜索引擎是一个为你提供信息“检索”服务的网站,它使用某些程序把因特网上的所有信息归 类以帮助人们在茫茫网海中搜寻到所需要的信息。早期的搜索引擎是把因特网中的资源服务器的地址收集起来,由其提供的资源的类型不同而分成 不同的目录,再一层层地进行分类。人们要找自己想要的信息可按他们的分类一层层进入,就能最后 到达目的地,找到自己想要的信息。这其实是最原始的方式,只适用于因特网信息并不多的时

9、候。随 着因特网信息按几何式增长,出现了真正意义上的搜索引擎,这些搜索引擎知道网站上每一页的开 始,随后搜索因特网上的所有超级链接,把代表超级链接的所有词汇放入一个数据库。这就是现在搜 索引擎的原型。2.1 搜索引擎的分类1.目录式搜索引擎以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于 事先确定的分类框架中。信息大多面向网站,提供目录浏览服务和直接检索服务。该类搜索引擎因为 加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介入、维护量大、信息量少、信息更 新不及时。这类搜索引擎的代表是:Yahoo、Open Directory、Go Guide等。

10、其特点是以人工方式或半自动方式搜集信息,编辑人员在访问了某个Web站点后形成信息摘要,并根据站点的内容和性质将其归为一个预先分好的类别,把站点的URL和描述放在这个类别中,当用户查询某个关键词时,搜索软件只在这些描述中进行搜索。很多目录也接受用 户提交的网站和描述,当目录的编辑人员认可该网站及描述后,就会将之添加到合适的类别中。目录 式搜索引擎的优点是信息准确、导航质量高。这类搜索引擎的缺点也是显而易见的,由于人工的介 入,使得费用增加,而且维护量大、信息量少、信息更新不及时。2基于Robot的搜索引擎基于Robot的搜索引擎也称基于机器人Robot的搜索引擎。特点是由一个称为Robot (也

11、叫做Spider、WebCrawle或WebWanderer的机器人程序以某 种策略自动地在互联网中搜集和发现信息,由索引系统为搜集到的信息建立索引,由查询接口根据用户的查询 输入检索索引库,并将查询结果返回给用户。服务方式是面向网页的全文检索服务。它的一个重要特 征是,搜索引擎要定期访问大多数以前搜集的网页,刷新索引,以反映出网页的更新情况,去除一些 死链接,网页的部分内容和变化情况将会反映到用户查询的结果中。基于Robot的搜索引擎的优点是 信息量大、更新及时、毋需人工干预。现在的许多搜索引擎都属于此类,例如 Google,AltaVista 等。它的缺点是返回信息过多,有很多无关信息,用

12、户必须从结果中进行筛选。3.M eta搜索引擎Meta搜索引擎也叫做元搜索引擎(MultipleSearchEngine),被称为搜索引擎之上的搜索引擎。用 户只需递交一次检索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将 所有查询结果集中起来以整体统一的格式呈现到用户面前。由于采用了一系列的优化运行机制,它能 够在尽可能短的时间内提供相对全面、准确的信息,而且即使不能完全满足用户需求,仍可以作为相 对可靠的参考源进行扩展搜索,因此成为备受推崇的检索首选入口。它的特点是本身并没有存放网页信息的数据库,当用户查询一个关键词时,它把用户 的查询请求 转换成其它搜索引擎能够接

13、受的命令格式,并行地访问数个搜索引擎来查询这个关键词,并把搜索引擎 返回的结果进行重复排除、重新排序等处理后再返回给用户。在目前所存在的搜索引擎中,没有一个搜索引擎能够覆盖所有的WWW资源,大部分的搜索引擎都只能涉及到整个资源的一小部分,并且各类搜索引擎的信息来源差异较大,因此集成多 个搜索引擎而产生的Meta搜索引擎具有比传统引擎覆盖面大,搜索效果更好且具有可扩展性等优点。 它的缺点是有一定的局限性,不能够充分使用所使用搜索引擎的功2.2搜索引擎的工作原理与主要技术搜索引擎的工作原理是:由一个Robot尽可能多地收集WWW上的网页,按照每个网页 的文本内容 建立单词到网页的反向索引,用户在查

14、询感兴趣的主题时,输入该主题的关键字作为查询条件,搜索 引擎利用事先建立好的网页库和单词索引,检索出符合条件的网页返回给用户。1. 信息搜集系统信息搜集系统是通过Robot来自动完成的,Robot在In ternet中漫游,尽可能多、尽可能 快地 搜集各种类型的新信息。由于In ternet上的信息量十分巨大,而且更新很快,因此,为了保证搜索 引擎上的信息的完整性和时效性,就要求Robot具有理想的搜索策略和很高的搜索效率。目前主要有 2种搜集信息的策略:(1)从一个起始U RL集合开始,顺着这些URL中的超链接(Hyperlink),以宽度优 先、深度优先或启发式方式循环地在互联网中发现信息

15、。这 些起始URL可以是任意的URL,但常常是一 些非常流行、包含很多链接的站点(如Yahoo!)。(2)将Web空间按照域名、IP地址或国家域名划分,每个搜索器负责一个子空间的穷尽搜索。2. 索引系统Robot搜集信息后,由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的所有关键词、关键词位置、生成时间、大小、与其 它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面文字 中及超链接中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。一 个搜索引擎的有效性在很大程度上取决于索引的质量。

16、3. 查询接口当用户提出查询要求时,搜索引擎根据用户的查询在索引数据库中快速检出文档,进 行文档与查 询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制。主要的目的是方便用 户使用搜索引擎,高效率、多方式地从搜索引擎中得到有效、及时的信息。查询接口的设计和实现使用 人机交互的理论和方法,以充分适应人类的思维习惯。3人工智能技术及其在搜索引擎中的应用研究In ternet迅速的发展,使得网上的信息呈现指数级增长,In ternet的问题已经从 提供信息”转到“如何从浩如烟海的信息中提取对自己有用的信息资源”。现有的搜索引擎存在着返回的无 用信息太多、搜索效率低下、信息组织混乱等缺陷。起源于20世纪50年代的人工智 能(AI)技术, 可以在In ternet中导引用户,不仅在用户进行搜索、浏

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号