计算机网络专业毕业论文microsoft

上传人:kms****20 文档编号:41122386 上传时间:2018-05-28 格式:DOC 页数:9 大小:38KB
返回 下载 相关 举报
计算机网络专业毕业论文microsoft_第1页
第1页 / 共9页
计算机网络专业毕业论文microsoft_第2页
第2页 / 共9页
计算机网络专业毕业论文microsoft_第3页
第3页 / 共9页
计算机网络专业毕业论文microsoft_第4页
第4页 / 共9页
计算机网络专业毕业论文microsoft_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《计算机网络专业毕业论文microsoft》由会员分享,可在线阅读,更多相关《计算机网络专业毕业论文microsoft(9页珍藏版)》请在金锄头文库上搜索。

1、计算机网络专业毕业论文计算机网络专业毕业论文 MicrosoftMicrosoft南昌航空大学 Nanchang Hangkong University 毕 业 论 文题目 _搜索引擎原理及发展趋势_学院 _江西工业工程职业学校 _专业 _计算机网络_姓名 周文飞_学号 036811100078 指导老师 李国忠_职称_ _2012_年_5_月_5_ 日_ 目 录第一章 搜索引擎的概述 31.1 搜索引擎 31.2 搜索引擎的发展史 3 第二章 搜索引擎基本常识 92.1 搜索引擎工作原理 92.2 搜索引擎分类 92.3 全文搜索引擎 10 第三章 使用搜索引擎 的一些基本规则和技巧 123

2、.1 搜索引擎的一些基本规则 123.2 搜索引擎的一些基本技巧 12 第四章 搜索引擎的评测 164.1 搜 索 引 擎缺陷 164.2 搜索速度 16 第五章 搜索引擎的未来发展动向及趋势 185.1 搜索引擎的未来发展动向 185.2 搜索引擎趋势 19 结束语 23 致 谢 24 参考文献 25 第 一 章 搜 索 引 擎 的 概 述 1.1 搜 索 引 擎 搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户

3、搜索引擎与免费链接列表等。百度和谷歌等是搜索引擎的代表。 搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。百度和谷歌等是搜索引擎的代表。1.2 搜 索 引 擎 的 发 展 史 互联网发展早期,以雅虎为代表的网站分类目录查询非常流行。网站分类目录由人工整理维护,精选互联网上的优秀网站,并简要描述,分类放置到不同目录下。用户查询时,通过一层层的点击来查找自己想找的网站。也有人把这种基于目录的检

4、索服务网站称为搜索引擎,但从严格意义上讲,它并不是搜索引擎。 1990 年,加拿大麦吉尔大学(University of McGill)计算机学院的师生开发出 Archie。当时,万维网(World Wide Web)还没有出现,人们通过 FTP 来共享交流资源。Archie 能定期搜集并分析 FTP 服务器上的文件名信息,提供查找分别在各个 FTP 主机中的文件。用户必须输入精确的文件名进行搜索,Archie 告诉用户哪个 FTP 服务器能下载该文件。虽然 Archie 搜集的信息资源不是网页(HTML 文件) ,但和搜索引擎的基本工作方式是一样的:自动搜集信息资源、建立索引、提供检索服务。

5、所以,Archie 被公认为现代搜索引擎的鼻祖。起源 所有搜索引擎的祖先,是 1990 年由 Montreal 的 McGill University 三名学生(Alan Emtage、Peter Deutsch、Bill Wheelan)发明的 Archie(ArchieFAQ) 。Alan Emtage 等想到了开发一个可以用文件名查找文件的系统,于是便有了 Archie。Archie 是第一个自动索引互联网上匿名 FTP 网站文件的程序,但它还不是真正的搜索引擎。Archie 是一个可搜索的 FTP 文件名列表,用户必须输入精确的文件名搜索,然后 Archie 会告诉用户哪一个 FTP

6、地址可 以 下 载 该 文 件 。 由 于 Archie 深 受 欢 迎 , 受 其 启 发 , Nevada SystemComputing Services 大学于 1993 年开发了一个 Gopher(Gopher FAQ)搜索工具 Veronica(Veronica FAQ) 。Jughead 是后来另一个 Gopher 搜索工具。发 展(1) Excite 的历史可以上溯到 1993 年 2 月,6 个 Stanford University(斯坦福大学)大学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。到 1993 年中,这已是一个完全投资项目,他们还发布了一个供

7、webmasters 在自己网站上使用的搜索软件版本,后来被叫做 Excite for WebServers。 注:Excite 后来曾以概念搜索闻名,2002 年 5 月,被 Infospace 收购的 Excite 停止自己的搜索引擎,改用元搜索引擎 Dogpile 发 展(2) 1994 年 4 月,斯坦福大学的两名博士生,美籍华人杨致远和 David Filo 共同创办了 Yahoo! 。随着访问量和收录链接数的增长,Yahoo 目录开始支持简单的数据库搜索。因为 Yahoo 的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。Yahoo 中收录的网站,因为都附

8、有简介信息,所以搜索效率明显提高。 注:Yahoo 以后陆续有 Altavista、Inktomi、Google 提供搜索引擎服务 Yahoo几乎成为 20 世纪 90 年代的因特网的代名词。发 展(3) 1995 年,一种新的搜索引擎形式出现了元搜索引擎(Meta SearchEngine) 。用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。 第一个元搜索引擎,是 Washington 大学硕士生 Eric Selberg 和 OrenEtzioni 的 Metacrawler。元搜索引

9、擎概念上非常好听,但搜索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。发 展(4) 智能检索的产生:它利用分词词典、同义词典,同音词典改善检索效果,进一步还可在知识层面或者说概念层面上辅助查询,通过主题词典、上下位词典、相关同级词典检索处理形成一个知识体系或概念网络,给予用户智能知识提示,最终帮助用户获得最佳的检索效果。 例: (1)查询“计算机” ,与“电脑”相关的信息也能检索出来; (2)可以进一步缩小查询范围至“微机” 、 “服务器”或扩大查询至“信息技术”或查询相关的“电子技术” 、 “软件” 、 “计算机应用”等范畴; (3)还包括歧义信息和检索处理,如“苹果” ,究竟是指水果

10、还是电脑品牌, “华人”与“中华人民共和国”的区分,将通过歧义知识描述库、全文索引、用户检索上下文分析以及用户相关性反馈等技术结合处理,高效、准确地反馈给用户最需要的信息。发 展(5) 个性化趋势是搜索引擎的一个未来发展的重要特征和必然趋势之一。一种方式通过搜索引擎的社区化产品(即对注册用户提供服务)的方式来组织个人信息,然后在搜索引擎基础信息库的检索中引入个人因素进行分析,获得针对个人不同的搜索结果。自 2004 年 10 月 yahoo 推出 myweb 测试版,到 11 月 a9 推出个性化功能,到 2005 年 Googlesearchhistory 基本上都沿着一条路子走,分析特定用

11、户的搜索需求限定的范围,然后按照用户需求范围扩展到互联网上其他的同类网站给出最相关的结果。另外一种是针对大众化的,Google 个性化搜索引擎,或者 yahooMindSet,或者我们都知道的前台聚类的 vivisimo。但是无论其中的哪一种实现方式,即 Google 的主动选择搜索范围,还是 yahoo,vivisimo 的在结果中重新组织自己需要的信息,都是一种实验或者创想,短期内无法成为主流的搜索引擎应用产品。发 展(6) 网格技术(great global grid:由于没有统一的信息组织标准对网络信息资源进行加工处理,难以对无序的网络信息资源进行检索、交接和共享乃至深层次的开发利用,

12、形成信息孤岛。网格技术就是要消除信息孤岛实现互联网上所有资源的全面连通。 国全球信息网格(Global Information Grid Robot(机器人)一词对编程者有特殊的意义。Computer Robot 是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。由于专门用于检索信息的 Robot 程序像蜘蛛spider 一样在网络间爬来爬去,因此,搜索引擎的 Robot 程序被称为 spider 程序。 1993 年 Matthew Gray 开发了 World Wide Web Wanderer,这是第一个利用 HTML 网页之间的链接关系来检测万维网规模的“机器人(Robot

13、) ”程序。开始,它仅仅用来统计互联网上的服务器数量,后来也能够捕获网址(URL) 。 1994 年 4 月,斯坦福大学(Stanford University)的两名博士生,美籍华人 Jerry Yang(杨致远)和 David Filo 共同创办了 Yahoo。随着访问量和收录链接数的增长,Yahoo 目录开始支持简单的数据库搜索。因为 Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。雅虎于 2002 年 12 月 23 日收购 inktomi,2003 年 7 月 14 日收购包括 Fast 和 Altavista 在内的 Overture,200

14、3 年 11 月,Yahoo 全资收购 3721 公司。 1994 年 初 , 华 盛 顿 大 学 ( University of Washington ) 的 学 生 BrianPinkerton 开始了他的小项目 WebCrawler。1994 年 4 月 20 日,WebCrawler 正式亮相时仅包含来自 6000 个服务器的内容。 WebCrawler 是互联网上第一个支持搜索文件全部文字的全文搜索引擎,在它之前,用户只能通过 URL 和摘要搜索,摘要一般来自人工评论或程序自动取正文的前 100 个字。 1994 年 7 月, 卡内基梅隆大学 (Carnegie Mellon Uni

15、versity) 的 MichaelMauldin 将 John Leavitt 的 spider 程序接入到其索引程序中,创建了 Lycos。除了相关性排序外,Lycos 还提供了前缀匹配和字符相近限制,Lycos 第一个在搜索结果中使用了网页自动摘要,而最大的优势还是它远胜过其它搜索引擎的数据量。 1994 年底,Infoseek 正式亮相。其友善的界面,大量的附加功能,使之和 Lycos 一样成为搜索引擎的重要代表。 1995 年, 一种新的搜索引擎形式出现了元搜索引擎 (A Meta SearchEngine Roundup) 。用户只需提交一次搜索请求,由元搜索引擎负责转换处理,提交

16、给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。第一个元搜索引擎,是 Washington 大学硕士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler。 1995 年 12 月,DEC 的正式发布 AltaVista。AltaVista 是第一个支持自然语言搜索的搜索引擎,第一个实现高级搜索语法的搜索引擎(如 AND、OR、 NOT 等。用户可以用 AltaVista 搜索新闻组(Newsgroups)的内容并从互联网上获得文章, 还可以搜索图片名称中的文字、 搜索 Titles、 搜索 Javaapplets、搜索 ActiveX objects。AltaVista 也声称是第一个支持用户自己向网页索引库提交或删除 URL 的搜索引擎,并能在 24 小时内上线。AltaV

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号