搜索引擎的历史

上传人:wm****3 文档编号:40728413 上传时间:2018-05-27 格式:DOC 页数:3 大小:27.50KB
返回 下载 相关 举报
搜索引擎的历史_第1页
第1页 / 共3页
搜索引擎的历史_第2页
第2页 / 共3页
搜索引擎的历史_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《搜索引擎的历史》由会员分享,可在线阅读,更多相关《搜索引擎的历史(3页珍藏版)》请在金锄头文库上搜索。

1、搜索引擎的历史.txt38 当乌云布满天空时,悲观的人看到的是“黑云压城城欲摧” ,乐观的 人看到的是“甲光向日金鳞开” 。无论处在什么厄运中,只要保持乐观的心态,总能找到这 样奇特的草莓。所有搜索引擎的祖先,是 1990 年由 Montreal 的 McGill University 学生 Alan Emtage、Peter Deutsch、Bill Wheelan 发明的 Archie(Archie FAQ)。当时 World Wide Web 还未出现。Archie 是第一个自动索引互联网上匿名 FTP 网站文件的程序,但它还 不是真正的搜索引擎。Archie 是一个可搜索的 FTP 文

2、件名列表,用户必须输入精确的文件 名搜索,然后 Archie 会告诉用户哪一个 FTP 地址可以下载该文件。 由于 Archie 深受欢迎,受其启发,Nevada System Computing Services 大学于 1993 年开 发了一个 Gopher(Gopher FAQ)搜索工具 Veronica(Veronica FAQ) 。Jughead 是后来另一 个 Gopher 搜索工具。 由于专门用于检索信息的 Robot 程序象蜘蛛(spider)一样在网络间爬来爬去,因此,搜索引 擎的 Robot 程序被称为 spider(Spider FAQ)程序。世界上第一个 Spider

3、程序,是 MIT Matthew Gray 的 World wide Web Wanderer,用于追踪互联网发展规模。刚开始它只用来统 计互联网上的服务器数量,后来则发展为也能够捕获网址(URL) 。 与 Wanderer 相对应,1993 年 10 月 Martijn Koster 创建了 ALIWEB(Martijn Koster Annouces the Availability of Aliweb) ,它相当于 Archie 的 HTTP 版本。ALIWEB 不使用 网络搜寻 Robot,如果网站主管们希望自己的网页被 ALIWEB 收录,需要自己提交每一个网 页的简介索引信息,类似

4、于后来大家熟知的 Yahoo。 1993 年底,一些基于此原理的搜索引擎开始纷纷涌现,其中最负盛名的三个是:Scotland 的 JumpStation、Colorado 大学 Oliver McBryan 的 The World Wide Web Worm(First Mention of McBryans World Wide Web Worm) 、NASA 的 Repository-Based Software Engineering (RBSE) spider。 1993 年 2 月,6 个 Stanford(斯坦福)大学生的想法是分析字词关系,以对互联网上的大 量信息作更有效的检索。

5、这就是 Excite。后来曾以概念搜索闻名,2002 年 5 月,被 Infospace 收购的 Excite 停止自己的搜索引擎,改用元搜索引擎 Dogpile 1994 年 1 月,第一个既可搜索又可浏览的分类目录 EINet Galaxy(Tradewave Galaxy)上 线。除了网站搜索,它还支持 Gopher 和 Telnet 搜索。 1994 年 4 月,Stanford 两名博士生,美籍华人 Jerry Yang(杨致远)和 David Filo 共同 创办了 Yahoo。随着访问量和收录链接数的增长,Yahoo 目录开始支持简单的数据库搜索。 因为 Yahoo!的数据是手工

6、输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索 的目录。搜索效率明显提高。 (Yahoo 以后陆续使用 Altavista、Inktomi、Google 提供搜索 引擎服务) 1994 年初,Washington 大学 CS 学生 Brian Pinkerton 开始了他的小项目 WebCrawler(Brian Pinkerton Announces the Availability of Webcrawler) 。1994 年 4 月 20 日,WebCrawler 正式亮相时仅包含来自 6000 个服务器的内容。WebCrawler 是互联网 上第一个支持搜索文件全部文字的全文

7、搜索引擎,在它之前,用户只能通过 URL 和摘要搜索, 摘要一般来自人工评论或程序自动取正文的前 100 个字。 (后来 webcrawler 陆续被 AOL 和Excite 收购,现在和 excite 一样改用元搜索引擎 Dogpile) Lycos(Carnegie Mellon University Center for Machine Translation Announces Lycos )是搜索引擎史上又一个重要的进步。Carnegie Mellon University 的 Michael Mauldin 将 John Leavitt 的 spider 程序接入到其索引程序中,创

8、建了 Lycos。1994 年 7 月 20 日, 数据量为 54,000 的 Lycos 正式发布。除了相关性排序外,Lycos 还提供了前缀匹配和字符 相近限制,Lycos 第一个在搜索结果中使用了网页自动摘要,而最大的优势还是它远胜过其 它搜索引擎的数据量:1994 年 8 月394,000 documents;1995 年 1 月1.5 million documents;1996 年 11 月over 60 million documents。 (注:1999 年 4 月,Lycos 停 止自己的 Spider,改由 Fast 提供搜索引擎服务) Infoseek(Steve Kir

9、sch Announces Free Demos Of the Infoseek Search Engine)是另 一个重要的搜索引擎,虽然公司声称 1994 年 1 月已创立,但直到年底它的搜索引擎才与公 众见面。起初,Infoseek 只是一个不起眼的搜索引擎,它沿袭 Yahoo!和 Lycos 的概念,并 没有什么独特的革新。但是它的发展史和后来受到的众口称赞证明,起初第一个登台并不总 是很重要。Infoseek 友善的用户界面、大量附加服务(such as UPS tracking, News, a directory, and the like) 使它声望日隆。而 1995 年 12

10、 月与 Netscape 的战略性协议,使 它成为一个强势搜索引擎:当用户点击 Netscape 浏览器上的搜索按钮时,弹出 Infoseek 的 搜索服务,而此前由 Yahoo!提供该服务。 (注:Infoseek 后来曾以相关性闻名,2001 年 2 月,Infoseek 停止了自己的搜索引擎,开始改用 Overture 的搜索结果) 1995 年,一种新的搜索引擎形式出现了元搜索引擎(A Meta Search Engine Roundup) 。 用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索 引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后

11、再返回给用户。第一个 元搜索引擎,是 Washington 大学硕士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler。元搜索引擎概念上好听,但搜索效果始终不理想,所以没有哪个元搜索引擎 有过强势地位。 DEC 的 AltaVista(2001 年夏季起部分网友需通过 p-roxy 访问,无 p-roxy 可用 qbseach 单 选 altavista 搜索,只能显示第一页搜索结果)是一个迟到者,1995 年 12 月才登场亮相 (AltaVista Public Beta Press Release ) 。但是,大量的创新功能使它迅速到达当时搜 索引擎的

12、顶峰。Altavista 最突出的优势是它的速度(搜索引擎 9238:比较搞笑,设计 altavista 的目的,据说只是为了展示 DEC Alpha 芯片的强大运算能力) 。 而 Altavista 的 另一些新功能,则永远改变了搜索引擎的定义。AltaVista 是第一个支持自然语言搜索的搜 索引擎,AltaVista 是第一个实现高级搜索语法的搜索引擎(如 AND, OR, NOT 等)。用户可 以用 AltaVista 搜索 Newsgroups(新闻组)的内容并从互联网上获得文章,还可以搜索图 片名称中的文字、搜索 Titles、搜索 Java applets、搜索 ActiveX

13、objects。AltaVista 也 声称是第一个支持用户自己向网页索引库提交或删除 URL 的搜索引擎,并能在 24 小时内上 线。AltaVista 最有趣的新功能之一,是搜索有链接指向某个 URL 的所有网站。在面向用户 的界面上,AltaVista 也作了大量革新。它在搜索框区域下放了“tips”以帮助用户更好的 表达搜索式,这些小 tip 经常更新,这样,在搜索过几次以后,用户会看到很多他们可能从 来不知道的的有趣功能。这系列功能,逐渐被其它搜索引擎广泛采用。1997 年,AltaVista 发布了一个图形演示系统 LiveTopics,帮助用户从成千上万的搜索结果中找到想要的。

14、然后到来的是 HotBot。1995 年 9 月 26 日,加州伯克利分校 CS 助教 Eric Brewer、博士生 Paul Gauthier 创立了 Inktomi(UC Berkeley Announces Inktomi) ,1996 年 5 月 20 日, Inktomi 公司成立,强大的 HotBot 出现在世人面前。声称每天能抓取索引 1 千万页以上, 所以有远超过其它搜索引擎的新内容。HotBot 也大量运用 cookie 储存用户的个人搜索喜好 设置。 (Hotbot 曾是随后几年最受欢迎的搜索引擎之一,后被 Lycos 收购) Northernlight 公司于 1995 年 9 月成立于马萨诸塞州剑桥,1997 年 8 月,Northernlight 搜索引擎正式现身。它曾是拥有最大数据库的搜索引擎之一,它没有 Stop Words,它有出 色的 Current News、7,100 多出版物组成的 Special Collection、良好的高级搜索语法, 第一个支持对搜索结果进行简单的自动分类。 (2002 年 1 月 16 日,Northernlight 公共搜索 引擎关闭,随后被 divine 收购,但在 Nlresearch,选中“World Wide Web only“,仍可使 用 Northernlight 搜索引擎)

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 高中教育 > 物理资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号