几种常见的搜索引擎的性能比较与分析2

上传人:壹****1 文档编号:465824252 上传时间:2023-10-03 格式:DOCX 页数:32 大小:117.01KB
返回 下载 相关 举报
几种常见的搜索引擎的性能比较与分析2_第1页
第1页 / 共32页
几种常见的搜索引擎的性能比较与分析2_第2页
第2页 / 共32页
几种常见的搜索引擎的性能比较与分析2_第3页
第3页 / 共32页
几种常见的搜索引擎的性能比较与分析2_第4页
第4页 / 共32页
几种常见的搜索引擎的性能比较与分析2_第5页
第5页 / 共32页
点击查看更多>>
资源描述

《几种常见的搜索引擎的性能比较与分析2》由会员分享,可在线阅读,更多相关《几种常见的搜索引擎的性能比较与分析2(32页珍藏版)》请在金锄头文库上搜索。

1、闽江学院本科毕业论文题目几种常见的搜索引擎性能比较与分析学生姓名吴宽富学号系别物理系与电子信息工程系年级2008 级专业电子信息工程指导教师林宏职称讲师完成日期2012-5-10声明闽江学院毕业论文(设计)诚信声明书本人郑重声明:兹提交的毕业论文(设计)几种常见的搜索引擎的性能比较与分 析,是本人在指导老师林宏老师的指导下独立研究、撰写的成果; 论文(设计)未剽窃、抄袭他人的学术观点、思想和成果,未篡改研 究数据,论文(设计)中所引用的文字、研究成果均已在论文(设计) 中以明确的方式标明;在毕业论文(设计)工作过程中,本人恪守学 术规范,遵守学校有关规定,依法享有和承担由此论文(设计)产生 的

2、权利和责任。声明人(签名):年 月 日摘要本文研究的目的是为了让我们更好的理解目前常见的几种搜索引擎,熟悉 它,认识它,用好它,让它们成为我们工作生活、学习和工作的好帮手。本文主要是对搜索引擎的初显、发展做大概的叙述,对搜索引擎的技术原理、 工作的原理、系统构架等做简单分析,希望大家可以对搜索引擎有进一步的了解, 同时对我们常用的几种搜索引擎进行分类,并对搜索结果的排序方法进行研究 最后通过几个指标对常见的几种搜索引擎做性能比较与分析,并通过实例来说明 搜索引擎的应用,从而让大家对搜索引擎有更深的认识,让搜索引擎更好地为我 们学习、生活和工作服务。关键词:搜索引擎 排序方法 性能比较 性能分析

3、刷红色处要用书面语刷紫色处是我改好的英文翻译要一并跟上AbstractThis thesis is about to ultimately make people have a detailed knowledge of some common search engines at present. With knowing them, be familiar with them and taking advantage of them well, we can have them as good helpers in our daily lives, study and work.This t

4、hesis mainly to narrate the general appearance and development of search engines, and analyse particularly search engines technique principle, work principle, system architecture and so on. It is hoped that people would be able to know better about the search engines. Meanwhile, some common search e

5、ngines are sorted, and their results-basically-sorted methods are analysed. With the comparison and analysis among the common search engines and showing how to make use of them effectively, this paper is attempt to help people understand search engines more deeply, and make search engines serve our

6、study, daily lives and work better.Key words : Search engines; Sorting method ; Performance comparison ; Performance analysis目录* (这里头有误吧)声明2摘要3ABSTRACT4第一章课题背景知识11.1搜索引擎的初显11.2搜索引擎的发展2第二章 常见几种搜索引擎32.1搜索引擎的原理32.2搜索引擎的分类5第三章常用搜索引擎的结果排序方法63.2DirectHit 算法73.3 PageRank 算法73.2竞价排名法9第四章常用的几种搜索引擎的性能比较及性能分析1

7、04.1数据库114.2检搜结果124.3用户界面13第五章常用的几种搜索引擎实际应用与性能分析16参考文献25感谢25第一章课题背景知识近几年,随着网络的不断发展和壮大,搜索引擎越来越成为人们生活中重要的一部 分,找资料、查地图、听音乐,只有想不到的,没有搜索不到的。中国二十多年来互联 网的不断发展,造就出5亿的网民,搜索引擎也出现空前的火热。各种分类的行业网站 也慢慢的兴起,使得搜索引擎越来越成为人们生活中必不可少的实用工具。搜索引擎的出现,整合了众多网站信息,恰恰起到了信息导航的作用。通用搜索引 擎就如同互联网第一次出现的门户网站一样,大量的信息整合导航,极快的查询,将所 有网站上的信息

8、整理在一个平台上供网民使用,于是信息的价值第一次普遍的被众多商 家认可,迅速成为互联网中最有价值的领域。大家熟知的搜索引擎Google、百度、雅虎 等是通用搜索引擎现如今的杰出代表,他们为互联网的发展做出了重要的贡献。总而言之搜索引擎改变了人们的生活,给人们的生活工作学习带来了巨大的帮助。1.1搜索引擎的初显(刷白什么意思? !)搜索引擎从1990年原型初显,进过三十多年的发展,现在成为人们生活中必不可 少的一部分,它经历了太多技术和观念的变革。搜索引擎出现之前,互联网上就已经存在很多旨在让人们共享的信息资源了。这些 资源当时主要存在于各种允许匿名访问的FTP站点。为了便于人们在分散的FTP资

9、源中 找到他们所需的东西,1990年,加拿大麦吉尔大学(McGillUniversity)的几个大学生 开发了一个软件Archie。它是一个可搜索的FTP文件名列表,用户必须输入精确的文件 名搜索,然后Archie会告诉用户哪一个FTP地址可以下载这个文件。Archie实际上是 一个大型的数据库,再加上与这个大型数据库相关联的一套检索方法。Archie虽然还不 是搜索引擎,但是从它的工作原理上看,它是所有搜索引擎的祖先。当万维网(WorldWideWeb)出现以后,人们可以通过html传播网页信息,网络上 的信息开始成倍增长。人们纷纷使用各种方法将网络上的信息搜集来,进行分类、整理, 以方便查

10、找。现在人们很熟悉的网站雅虎(Yahoo)就是在这个环境下诞生的。还在 Stanford大学读书的美籍华人杨致远和他的同学迷上了互联网。他们将互联网上有趣的 网页搜集过来,与同学一起分享。后来,1994年4月,他们俩共同办了雅虎。随着访问 量和收录链接数的增长,雅虎目录开始支持简单的数据库搜索。但是因为雅虎的数据是 手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。1.2搜索引擎的发展当“蜘蛛”程序出现时,现代意义上的搜索引擎才初显端倪。它实际上是一种电脑 机器人”(ComputerRobot),电脑机器人”是指某个能以人类无法达到的速度不 间断地执行某项任务的软件程序。由于

11、专门用于检索信息的“机器人”程序就象蜘蛛一 样在网络间爬来爬去,反反复复,不知疲倦。所以,搜索引擎的“机器人”程序就被称 为“蜘蛛”程序。这种程序实际是利用html文档之间的链接关系,在Web上一个网页一个网页的爬 取(crawl),将这些网页抓到系统来进行分析,并放入数据库中。第一个开发出“蜘 蛛”程序的是MatthewGray,他于1993年开发了 WorldWideWebWanderer,它最初建立 时是为了统计互联网上的服务器数量,到后来发展到能够捕获网址。现代搜索引擎的思 路就来源于Wanderer,后来很多人在此基础上对蜘蛛程序进行了改进。1994年7月20日发布的Lycos网站第

12、一个将“蜘蛛”程序接入到其索引程序中。 引入“蜘蛛”后给其带来的最大优势就在于其远胜于其它搜索引擎的数据量。自此之后 几乎所有占据主导地位的搜索引擎中,都靠“蜘蛛”来搜集网页信息Infoseek是另一 个重要的搜索引擎,于1994年年底才与公众见面。起初,Infoseek 只是一个不起眼的 搜索引擎,它沿袭Yahoo!和Lycos的概念,并没有什么独特的革新。但是它友善的用户 界面、大量附加服务使它在用户中赢得了 口碑。1995年12月,它与Netscape的战略性 协议,使它成为一个强势搜索引擎:当用户点击Netscape浏览器上的搜索按钮时,弹 出Infoseek的搜索服务,而此前由Yah

13、oo!提供该服务。1995年12月15日,AltaVista 正式上线。它是第一个支持高级搜索语法的搜索引擎,成功地整合了此前人类所有的信 息检索技术,解决了包括字根处理、关键词检索、布尔逻辑,以及通过向量空间模型的 查询排名等关键问题。正式公开之前,AltaVista就已经拥有20万访问用户,在短短三 个星期之内,到访人数由每天30万次增加到200万次。它的成功在于满足了用户三个 方面的需求:网上索引范围超过了此前任何一家搜索引擎;短短几秒钟内便可从庞大的 数据库中为用户返回搜索结果;AltaVista小组从一开始就采用了一种模块设计技术, 能够跟踪网站的流行趋势,同时不断扩大处理能力。在当

14、时许多搜索引擎之中, AltaVista脱颖而出,成为网络搜索的代名词。Google就是站在这样的巨人的肩膀上颠 覆并创造着。“上网即搜索”改变了人们上网方式的,就是现在鼎鼎大名的Google。 Google并不是搜索引擎的发明者,甚至有点落后,但是它却让人们爱上了搜索。1998年9月,在佩奇和布林创建Google之时,业界对互联网搜索功能的理解是: 某个关键词在一个文档中出现的频率越高,该文档在搜索结果中的排列位置就要越显 著。这就引出了这样一个问题,如果一个页面充斥着某一个关键字的话,那么它将排在 很显著的位置,但这样一个页面对于用户来说,却没有任何意义。佩奇和布林发明了 “网 页级别”(

15、PageRank)技术,来排列搜索结果。即考察该页面在网上被链接的频率和重 要性来排列,互联网上指向这一页面的重要网站越多,该页面的位次也就越高。当从网 页A链接到网页B时,Google就认为“网页A投了网页B 一票”。Google根据网页的 得票数评定其重要性。然而,除了考虑网页得票数的纯数量之外,Google还要分析投票 的网页,“重要”的网页所投出的票就会有更高的权重,并且有助于提高其他网页的 “重要性”Google以其复杂而全自动的搜索方法排除了任何人为因素对搜索结果的影 响。没人能花钱买到更高的网页级别,从而保证了网页排名的客观公正。除此之外,动 态摘要、网页快照、多文档格式支持、地

16、图股票词典寻人等集成搜索也都深得网民的喜 爱。其他众多搜索引擎也都紧跟Google,推出这些服务。Fast (Alltheweb)公司发布 的搜索引擎AllTheWeb,总部位于挪威,其在海外的风头直逼Google。Alltheweb的网 页搜索支持Flash和pdf搜索,支持多语言搜索,还提供新闻搜索、图像搜索、视频、 MP3、和FTP搜索,拥有极其强大的高级搜索功能。而中国的百度更是凭借“更懂中文” 而吸引着中国的网络受众,它拥有超过10亿的中文网页数据库,并且,这些网页的数 量每天正以千万级的速度在增长。搜索引擎就越来越成为人们生活中重要的一部分。第二章常见的搜索引擎的原理和分类2.1搜索引擎的原理搜索引擎

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号