2022年搜索引擎的起源与发展推荐

上传人:博****1 文档编号:567303370 上传时间:2024-07-19 格式:PDF 页数:9 大小:74.04KB
返回 下载 相关 举报
2022年搜索引擎的起源与发展推荐_第1页
第1页 / 共9页
2022年搜索引擎的起源与发展推荐_第2页
第2页 / 共9页
2022年搜索引擎的起源与发展推荐_第3页
第3页 / 共9页
2022年搜索引擎的起源与发展推荐_第4页
第4页 / 共9页
2022年搜索引擎的起源与发展推荐_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《2022年搜索引擎的起源与发展推荐》由会员分享,可在线阅读,更多相关《2022年搜索引擎的起源与发展推荐(9页珍藏版)》请在金锄头文库上搜索。

1、搜索引擎的起源与发展搜索引擎的起源 : 所有搜索引擎的祖先, 是 1990 年由 Montreal 的 McGill University 三名学生(Alan Emtage、Peter Deutsch、Bill Wheelan)发明的 Archie(Archie FAQ ) 。Alan Emtage等想到了开发一个可以用文件名查找文件的系统,于是便有了Archie。Archie 是第一个自动索引互联网上匿名FTP网站文件的程序, 但它还不是真正的搜索引擎。Archie 是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie 会告诉用户哪一个FTP地址可以下载该文件。由于

2、 Archie 深受欢迎,受其启发,Nevada System Computing Services大学于 1993 年开发了一个Gopher (Gopher FAQ ) 搜索工具 Veronica(Veronica FAQ ) 。Jughead 是后来另一个 Gopher 搜索工具。发 展( 1) :世界上第一个Spider 程序,是MIT Matthew Gray 的 World wide Web Wanderer,用于追踪互联网发展规模。刚开始它只用来统计互联网上的服务器数量,后来则发展为也能够捕获网址(URL ) 。搜索引擎一般由以下三部分组成:爬行器(机器人、蜘蛛)索引生成器查询检索

3、器名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 9 页 - - - - - - - - - 发 展( 2) :Excite 的历史可以上溯到1993 年 2 月,6 个 Stanford University(斯坦福大学)大学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。到1993 年中,这已是一个完全投资项目,他们还发布了一个供webmasters 在自己网站上使用的搜索软件版本,后来被叫做 Excite for Web Servers。注:Excit

4、e后来曾以概念搜索闻名, 2002 年 5 月,被 Infospace 收购的 Excite停止自己的搜索引擎,改用元搜索引擎Dogpile 发 展( 3) :1994 年 4 月,斯坦福大学的两名博士生,美籍华人杨致远和David Filo 共同创办了 Yahoo! 。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。Yahoo!中收录的网站,因为都附有简介信息,所以搜索效率明显提高。注:Yahoo以后陆续有Altavista、Inktomi 、Google提供搜索引擎服务Yaho

5、o!几乎成为20 世纪 90 年代的因特网的代名词。发 展( 4) :1995 年,一种新的搜索引擎形式出现了元搜索引擎(Meta Search Engine) 。用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。第一个元搜索引擎, 是 Washington 大学硕士生Eric Selberg 和 Oren Etzioni 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共

6、 9 页 - - - - - - - - - 的 Metacrawler 。元搜索引擎概念上好听,但搜索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。发 展( 5) :智能检索的产生:它利用分词词典、同义词典,同音词典改善检索效果,进一步还可在知识层面或者说概念层面上辅助查询,通过主题词典、上下位词典、相关同级词典检索处理形成一个知识体系或概念网络,给予用户智能知识提示,最终帮助用户获得最佳的检索效果。例:(1)查询“计算机” ,与“电脑”相关的信息也能检索出来;(2)可以进一步缩小查询范围至“微机”、 “服务器”或扩大查询至“信息技术”或查询相关的“电子技术”、 “软件”、 “计算机应

7、用”等范畴;(3)还包括歧义信息和检索处理,如“苹果”,究竟是指水果还是电脑品牌, “华人”与“中华人民共和国”的区分,将通过歧义知识描述库、全文索引、用户检索上下文分析以及用户相关性反馈等技术结合处理,高效、准确地反馈给用户最需要的信息。发 展( 6) :个性化趋势是搜索引擎的一个未来发展的重要特征和必然趋势之一。一种方式通过搜索引擎的社区化产品(即对注册用户提供服务)的方式来组织名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 9 页 - - - - - - - - -

8、 个人信息,然后在搜索引擎基础信息库的检索中引入个人因素进行分析,获得针对个人不同的搜索结果。自2004 年 10 月 yahoo 推出 myweb 测试版,到 11 月 a9 推出个性化功能, 到 2005 年 Googlesearchhistory 基本上都沿着一条路子走,分析特定用户的搜索需求限定的范围,然后按照用户需求范围扩展到互联网上其他的同类网站给出最相关的结果。另外一种是针对大众化的, Google个性化搜索引擎, 或者 yahooMindSet,或者我们都知道的前台聚类的vivisimo。但是无论其中的哪一种实现方式,即Google的主动选择搜索范围, 还是 yahoo(htt

9、p:/ ) ,vivisimo 的在结果中重新组织自己需要的信息,都是一种实验或者创想,短期内无法成为主流的搜索引擎应用产品。发 展( 7) :网格技术( great global grid):由于没有统一的信息组织标准对网络信息资源进行加工处理,难以对无序的网络信息资源进行检索、交接和共享乃至深层次的开发利用,形成信息孤岛。网格技术就是要消除信息孤岛实现互联网上所有资源的全面连通。美国全球信息网格(Global Information Grid) Robot(机器人) 一词对编程者有特殊的意义。Computer Robot 是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。由于专

10、门用于检索信息的 Robot 程序像蜘蛛 (spider)一样在网络间爬来爬去,因此,搜索引擎的 Robot 程序被称为 spider 程序。1993 年 Matthew Gray 开发了World Wide Web Wanderer, 这是第一个利用HTML网页之间的链接关系来检测万维网规模的“机器人(Robot) ”程序。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 9 页 - - - - - - - - - 开始,它仅仅用来统计互联网上的服务器数量,后来也能够捕获

11、网址 (URL ) 。1994 年 4 月,斯坦福大学(Stanford University)的两名博士生,美籍华人Jerry Yang (杨致远)和 David Filo共同创办了 Yahoo。随着访问量和收录链接数的增长, Yahoo 目录开始支持简单的数据库搜索。因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。雅虎于2002 年 12 月 23 日收购 inktomi ,2003 年 7 月 14 日收购包括 Fast和 Altavista 在内的 Overture, 2003 年 11 月, Yahoo全资收购 3721公司。1994 年初

12、,华盛顿大学 (University of Washington )的学生 Brian Pinkerton开始了他的小项目WebCrawler。1994 年 4 月 20 日,WebCrawler 正式亮相时仅包含来自6000 个服务器的内容。 WebCrawler 是互联网上第一个支持搜索文件全部文字的全文搜索引擎,在它之前,用户只能通过URL和摘要搜索,摘要一般来自人工评论或程序自动取正文的前100 个字。1994 年 7 月,卡内基梅隆大学(Carnegie Mellon University) 的 Michael Mauldin 将 John Leavitt 的 spider 程序接入

13、到其索引程序中,创建了Lycos 。除了相关性排序外,Lycos还提供了前缀匹配和字符相近限制,Lycos第一个在搜索结果中使用了网页自动摘要,而最大的优势还是它远胜过其它搜索引擎的数据量。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 9 页 - - - - - - - - - 1994 年底, Infoseek 正式亮相。其友善的界面,大量的附加功能,使之和Lycos一样成为搜索引擎的重要代表。1995 年,一种新的搜索引擎形式出现了元搜索引擎(A Meta Sear

14、ch Engine Roundup) 。用户只需提交一次搜索请求,由元搜索引擎负责转换处理,提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。第一个元搜索引擎,是Washington 大学硕士生Eric Selberg 和 Oren Etzioni 的 Metacrawler 。1995 年 12 月,DEC的正式发布 AltaVista。AltaVista 是第一个支持自然语言搜索的搜索引擎, 第一个实现高级搜索语法的搜索引擎(如 AND、OR、NOT等)。用户可以用AltaVista 搜索新闻组 (Newsgroups)的内容并从互联网上

15、获得文章, 还可以搜索图片名称中的文字、搜索 Titles、搜索 Java applets 、搜索 ActiveX objects。 AltaVista 也声称是第一个支持用户自己向网页索引库提交或删除URL的搜索引擎,并能在24 小时内上线。 AltaVista 最有趣的新功能之一,是搜索有链接指向某个URL的所有网站。在面向用户的界面上,AltaVista 也作了大量革新。它在搜索框区域下放了“tips”以帮助用户更好的表达搜索式,这些小tip 经常更新,这样,在搜索过几次以后,用户会看到很多他们可能从来不知道的的有趣功能。这系列功能,逐渐被其它搜索引擎广泛采用。1997 年, AltaV

16、ista 发布了一个图形演示系统LiveTopics ,帮助用户从成千上万的搜索结果中找到想要的。1995 年 9 月 26 日,加州伯克利名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 9 页 - - - - - - - - - 分校助教 Eric Brewer、 博士生 Paul Gauthier 创立了Inktomi,1996 年 5 月 20 日, Inktomi 公司成立,强大的HotBot 出现在世人面前。声称每天能抓取索引1 千万页以上,所以有远超过其它搜索

17、引擎的新内容。 HotBot 也大量运用 cookie 储存用户的个人搜索喜好设置。1997 年 8 月,Northernlight 搜索引擎正式现身。它曾是拥有最大数据库的搜索引擎之一,它没有Stop Words,它有出色的Current News、7100 多出版物组成的 Special Collection、良好的高级搜索语法, 第一个支持对搜索结果进行简单的自动分类。1998 年 10 月之前, Google只是斯坦福大学(Stanford University)的一个小项目 BackRub 。 1995 年博士生 Larry Page开始学习搜索引擎设计, 于 1997年 9 月 1

18、5 日注册了 的域名,1997 年底,在 Sergey Brin和 Scott Hassan 、Alan Steremberg 的共同参与下, BachRub 开始提供 Demo。1999年 2 月, Google 完成了从 Alpha 版到 Beta 版的蜕变。Google 公司则把 1998年 9 月 27 日认作自己的生日。 Google 以网页级别( Pagerank)为基础,判断网页的重要性,使得搜索结果的相关性大大增强。Google 公司的奇客(Geek)文化氛围、不作恶(Dont be evil)的理念,为 Google 赢得了极高的口碑和品牌美誉。2006 年 4 月,Goo

19、gle 宣布其中文名称“谷歌” ,这是 Google 第一个在非英语国家起的名字。Fast (Alltheweb )公司创立于 1997 年,是挪威科技大学 (NTNU)学术研究的副产品。 1999 年 5 月,发布了自己的搜索引擎AllTheWeb。Fast 创立的目标是做世界上最大和最快的搜索引擎,几年来庶几近之。 Fast (Alltheweb)名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页,共 9 页 - - - - - - - - - 的网页搜索可利用ODP自动分类

20、,支持Flash和 pdf 搜索,支持多语言搜索,还提供新闻搜索、图像搜索、视频、MP3、和 FTP搜索,拥有极其强大的高级搜索功能。 (2003 年 2 月 25 日, Fast的互联网搜索部门被Overture收购) 。1996 年 8 月,sohu 公司成立,制作中文网站分类目录,曾有“出门找地图,上网找搜狐”的美誉。随着互联网网站的急剧增加,这种人工编辑的分类目录已经不适应。sohu 于 2004 年 8 月独立域名的搜索网站“搜狗”,自称“第三代搜索引擎” 。Openfind 创立于 1998 年 1 月,其技术源自台湾中正大学吴升教授所领导的 GAIS实验室。 Openfind 起

21、先只做中文搜索引擎,鼎盛时期同时为三大著名门户新浪、奇摩、雅虎提供中文搜索引擎,但2000 年后市场逐渐被Baidu 和 Google瓜分。2002 年 6 月,Openfind 重新发布基于GAIS30 Project的 Openfind 搜索引擎 Beta 版,推出多元排序( PolyRankTM) ,宣布累计抓取网页 35 亿,开始进入英文搜索领域。2000 年 1 月,两位北大校友,超链分析专利发明人、前Infoseek 资深工程师李彦宏与好友徐勇(加州伯克利分校博士后)在北京中关村创立了百度(Baidu)公司。 2001 年 8 月发布 B 搜索引擎 Beta 版(此前 Baidu

22、只为其它门户网站搜狐新浪 Tom 等提供搜索引擎) ,2001 年 10 月 22 日正式发布Baidu 搜索引名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 8 页,共 9 页 - - - - - - - - - 擎,专注于中文搜索。Baidu 搜索引擎的其它特色包括:百度快照、网页预览/预览全部网页、相关搜索词、错别字纠正提示、mp3 搜索、 Flash搜索。2002 年 3 月闪电计划( Blitzen Project)开始后,技术升级明显加快。后推出贴吧、 知道、地图、国学、

23、百科、文档、视频、博客等一系列产品,深受网民欢迎。 2005 年 8 月 5 日在纳斯达克上市,发行价为USD 27.00,代号为 BIDU。开盘价 USD 66.00,以 USD 122.54收盘,涨幅 353.85%,创下了 5 年以来美国股市上市新股当日涨幅最高纪录。2003 年 12 月 23 日,原慧聪搜索正式独立运做,成立了中国搜索。2004年 2 月,中国搜索发布桌面搜索引擎网络猪1.0,2006 年 3 月中搜将网络猪更名为 IG(Internet Gateway) 。2005 年 6 月,新浪正式推出自主研发的搜索引擎“爱问”。2007 年起,新浪爱问使用 google 搜索引擎。2007 年 7 月 1 日 全面采用网易自主研发的有道搜索技术,并且合并了原来的综合搜索和网页搜索。有道网页搜索、图片搜索和博客搜索为网易搜索提供服务。其中网页搜索使用了其自主研发的自然语言处理、分布式存储及计算技术;图片搜索首创根据拍摄相机品牌、型号,甚至季节等高级搜索功能;博客搜索相比同类产品具有抓取全面、更新及时的优势,提供“文章预览”, “博客档案”等创新功能名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 9 页,共 9 页 - - - - - - - - -

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号