文献检索信息检索第5章(搜索引擎)课件

上传人:我*** 文档编号:145862740 上传时间:2020-09-24 格式:PPT 页数:61 大小:1.27MB
返回 下载 相关 举报
文献检索信息检索第5章(搜索引擎)课件_第1页
第1页 / 共61页
文献检索信息检索第5章(搜索引擎)课件_第2页
第2页 / 共61页
文献检索信息检索第5章(搜索引擎)课件_第3页
第3页 / 共61页
文献检索信息检索第5章(搜索引擎)课件_第4页
第4页 / 共61页
文献检索信息检索第5章(搜索引擎)课件_第5页
第5页 / 共61页
点击查看更多>>
资源描述

《文献检索信息检索第5章(搜索引擎)课件》由会员分享,可在线阅读,更多相关《文献检索信息检索第5章(搜索引擎)课件(61页珍藏版)》请在金锄头文库上搜索。

1、Internet信息资源及其检索,搜索引擎,Internet信息资源,特点: 丰富、形式多样、交互性强等 种类: www、Telnet、FTP、用户服务组、Gopher等,Internet信息资源检索,检索方法: 1.基于超文本的信息查询 2.基于目录的信息查询 3.基于搜索引擎的信息查询 影响检索的因素: 1.信息资源质量对信息检索的影响 2.检索软件对信息检索的影响 3.用户水平对信息检索的影响,搜索引擎及其检索,搜索引擎发展史,现代意义上的搜索引擎的祖先,是1990年由Montreal的McGill University学生Alan Emtage、Peter Deutsch、Bill W

2、heelan发明的Archie 世界上第一个Spider程序,是MIT Matthew Gray的World wide Web Wanderer,用于追踪互联网发展规模。 Lycos是搜索引擎史上一个重要的进步。Carnegie Mellon University的Michael Mauldin将John Leavitt的spider程序接入到其索引程序中,创建了Lycos。,1994年4月,Stanford University的两名博士生,美籍华人Jerry Yang(杨致远)和David Filo共同创办了Yahoo。 1995年,一种新的搜索引擎形式出现了元搜索引擎。第一个元搜索引擎,

3、是Washington大学硕士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler。 DEC的AltaVista1995年12月才登场亮相。但是,大量的创新功能使它迅速到达当时搜索引擎的顶峰。,博士生Larry Page于1997年9月15日注册了的域名。Google在PageRank、动态摘要、网页快照、DailyRefresh、多文档格式支持、地图股票词典、寻人等集成搜索、多语言支持、用户界面等功能上的革新,从一定程度上改变了搜索引擎的定义。 2002年6月,Openfind重新发布基于GAIS30 Project的Openfind搜索引擎Beta版,推出

4、多元排序(PolyRankTM),宣布累计抓取网页35亿,北大天网是国家“九五”重点科技攻关项目“中文编码和分布式中英文信息发现”的研究成果 ,收录网页约6000万,利用教育网优势,有强大的ftp搜索功能。 Baidu 2000年1月,两位北大校友,超链分析专利发明人、前Infoseek资深工程师李彦宏与好友徐勇(加州伯克利分校博士后)在北京中关村创立了百度(Baidu)公司。,搜索引擎将进入战国时代? 微革命?,搜索引擎及其检索,一、搜索引擎的概念 二、搜索引擎的构成及工作原理 三、搜索引擎的检索功能 四、搜索引擎的分类 五、搜索引擎的使用技巧 六、常用中英文搜索引擎网站介绍,搜索引擎 Se

5、arch Engine Internet网络信息检索工具,一、搜索引擎的概念 Search Engine,搜索引擎是用来对网络信息资源管理和检索的一系列软件,是一种在Internet上查找信息的工具。,搜索引擎是一种用于帮助Internet用户查询信息的搜索工具,是Internet网络上的信息检索系统,它以一定的策略在Internet中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。,一、搜索引擎的概念 Search Engine,搜索引擎泛指在数据库系统中查找信息的工具,是那些在因特网上或通过因特网能够响应用户提交的搜索请求,返回相应查询结果的

6、信息技术和系统。它是一些站点中提供的将因特网网站和网页信息进行收集、整理和组织,从而帮助用户找到所需信息的手段。,搜索引擎实际上是个专用的WWW服务器,它存有庞大的索引数据库,收集了Internet上百万甚至上千万个WWW主页的信息。,一、搜索引擎的概念 Search Engine,搜索引擎结果信息列表中的条目至少有三个元素: 标题 URL 摘要,士兵突击,影视作品,历史事件,标题,摘要,URL,搜索引擎有两个主要的功能: 1、收集网络信息资源,对其进行 索引并建立数据库。 2、提供网络的信息导航与检索服 务(主要的功能)。,信息搜索 信息处理,信息查询,搜索引擎的主要任务,用 户 系 统,用

7、 户 接 口,搜索器,索引器,检索器,WWW信息资源,FTP信息资源,Telent信息资源,Ghopher信息资源,WAIS信息资源,用户服务组信息资源,搜索引擎,网络,网络,二、搜索引擎的构成及工作原理,搜索引擎:搜索器、索引器、检索器、用户接口,二、搜索引擎的构成及工作原理,二、搜索引擎的构成及工作原理,用 户 检 索 策 略,搜索 引擎 用户 接口,搜索引擎本地的 摘要信息数据库,各万维 网站点 资源,访问,详细信息反馈,摘要信 息反馈,各记录链接,信息资源搜集,用 户 检 索 策 略,搜索 引擎 用户 接口,搜索引擎的基本检索功能,1、布尔逻辑检索 逻辑与 (and、AND、 ) 逻辑

8、或(or、OR、|)多用于英文搜索引擎,大多数 情况下,两个关键词之间没有空格就相当于“或者” ,如计算 机病毒 逻辑非(not、NOT、!),三、搜索引擎的检索功能,搜索引擎的基本检索功能,2、 +、- 检索 +:放在检索词前,表示该检索词在检索结 果中必须出现。 -:放在检索词前,表示该检索词在检索结 果中不能出现。(-前必须空格) 几乎所有的搜索引擎都支持这种功能。 如:+计算机+病毒 CIH 或 计算机 病毒 -CIH,三、搜索引擎的检索功能,搜索引擎的基本检索功能,3、 截词检索(*或?) 前方一致检索 扩大检索范围 如nutri* nutria、nutrient、nutrilite

9、i、 nutriment 、nutrition 如要搜索“中学信息技术”及“小学信息技术”,则可输入学信息技术,三、搜索引擎的检索功能,搜索引擎的基本检索功能,4、完全字符串检索 采用双引号“”代表字符串 精确查找 “electronic magazine” “知识经济与社会发展”知识经济与社会发展,三、搜索引擎的检索功能,雪莱的诗里的“冬天已经来了,春天还会远吗”的英文原文 雪莱 spring “冬天已经来了,春天还会远吗” When Winter comes, can Spring be far behind? / If winter comes, can spring be far be

10、hind?,搜索引擎的基本检索功能,5、位置检索(Alta Vista) 邻近位置运算near运算 NEAR/n(n为1、2、3) 如 computer near/10 network,三、搜索引擎的检索功能,搜索引擎的高级检索功能,1、自然语言检索 支持字、词、句子检索 几乎所有的搜索引擎都支持该功能 如:知识经济的支柱产业 How has WTO developed? What is the Weather in London?,三、搜索引擎的检索功能,搜索引擎的高级检索功能,2、概念检索 用某一检索词进行检索时,能同时对该词同样或类似概念的同义词和近义词进行检索,以达到扩大检索范围,提高

11、查全率的目的。例如,当用户使用intellectual property right检索时,检索结果不仅包括含有上述词组的网页,还能检索出包含copy right等词组的网页。如:Excite,三、搜索引擎的检索功能,搜索引擎的高级检索功能,3、相关信息反馈检索 提供与检索结果类似的检索结果。如: 雅虎中国的“相关网站、相关网页、相关新闻”。 Lycos的“More Like This” Excite的“Search for more documents like this one”,三、搜索引擎的检索功能,搜索引擎的高级检索功能,4、区分大小写检索 它主要是针对检索词中含有人名、地名等专有名

12、词的情况。 大多数搜索引擎在查询中要区分大小写,在区分大小写的情况下, 小写匹配大小写字符 大写只匹配大写字符,检索词能被当 作专有名词看待 目前,AltaVista和Infoseek等工具有此特点。,三、搜索引擎的检索功能,搜索引擎的高级检索功能,5、范围限制检索 在某一范围内检索指定的检索词。 分类范围、时间范围、地域范围、信息来源、检索词位置、语种范围、特殊范围,三、搜索引擎的检索功能,字段限制检索 限定检索词在检索结果中出现的位置,用来控制检索结果的相关性。 标题限制(格式为title:检索式),如title:mars 主机名限制(格式为site:检索式/host:检索式), 如”ma

13、rs landing”+host:edu URL限制(格式为url:检索式),如url:home.html 链接检索(格式为link:检索式),如:link:nasa.gov,URL由存取协议、主机名、文件名三部分构成,其格式 为::/。,常用网络类型代码: com 商业机构 mil 军事部门 edu 教育机构 net 网管组织 gov 政府部门 org 非营利组织 int 国际组织,四、搜索引擎的分类,1、根据信息检索方式分类: 全文搜索引擎、分类搜索引擎、混合搜索引擎 2、根据信息覆盖范围及适用用户群分类: 综合性搜索引擎、专用性搜索引擎 3、根据搜索范围(功能)分类: 独立搜索引擎、集成

14、搜索引擎,五、搜索引擎的使用技巧,搜索之前先思考 学会使用多个关键词搜索 学会使用减号 点击搜索结果前先思考 改进检索提问,善于改正错误 适可而止,不要迷失,学习搜索的资源,1.加州伯克利分校图书馆的搜索教程(http:/www.lib.berkeley.edu/TeachingLib/Guides/Internet/FindInfo.html) 2.Searcher杂志( 3Online杂志( 4Webmasterworld(,4Searchtools( 5Search Engine Conference( 6Search Engine Watch ( 7Search Day(,学习中文搜索

15、的网站主要有:,1.搜索研究院(http:/www.dianbo.org/9238/); 2中文搜索引擎指南网的搜索引擎使用指导栏目(,六、常用的中英文搜索引擎网站介绍,全文式搜索引擎 目录式搜索引擎 元搜索引擎 特色搜索引擎,全文式搜索引擎,1Google() 2百度搜索引擎() 3中国搜索搜索引擎() 4北大“天网”() 5FAST/AllTheWeb() 6AltaVista(),7Lycos () 8EXCITE() 9InfoSeek(或 ) 10Aol() 11HotBot () 12WebCrawler (http:/www.WebC),1.Google搜索引擎应用,Google

16、简介,Google(www.G)是一个搜索引擎,由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年9月发明,Google Inc. 于1999年创立。2000年7月份,Google替代Inktomi成为Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎。98年至今,Google已经获得30多项业界大奖。到Google的新闻中心(http:/www.G,Google的强大的功能和独到的特点:,Google检索网页数量达42亿,搜索引擎中排名第一; Google支持多达130多种语言,包括简体中文和繁体中文; Google网站只提供搜索引擎功能,没有花里胡哨的累赘; Google速度极快,2003年初时据说有15000多台服务器,200多条T3级宽带; Google的专利网页级别技术PageRank能够提供准确率极高的搜索结果; Go

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号