网络信息检索课件

上传人:bin****86 文档编号:54304882 上传时间:2018-09-10 格式:PPT 页数:58 大小:1.55MB
返回 下载 相关 举报
网络信息检索课件_第1页
第1页 / 共58页
网络信息检索课件_第2页
第2页 / 共58页
网络信息检索课件_第3页
第3页 / 共58页
网络信息检索课件_第4页
第4页 / 共58页
网络信息检索课件_第5页
第5页 / 共58页
点击查看更多>>
资源描述

《网络信息检索课件》由会员分享,可在线阅读,更多相关《网络信息检索课件(58页珍藏版)》请在金锄头文库上搜索。

1、第三章 网络信息检索,第一节 网络信息检索工具与方法 第二节 搜索引擎及其检索,第一节 网络信息检索工具与方法,一、网络信息检索的特点 二、网络信息检索工具 三、网络信息检索的方法,一、网络信息检索的特点,1、存取范围覆盖Internet上所有资源 2、传统检索方法与全新检索技术相结合 3、用户界面友好且操作方便 4、具备良好的导航和编辑功能 5、用户透明度,二、网络信息检索工具,网络信息检索工具按照不同标准可以划分不同类型: 1、按照网络信息资源类型划分:WWW检索工具、非WWW检索工具 2、按照检索机制划分:关键词检索工具、分类目录检索工具、混合型检索工具 3、按照包含检索工具数量划分:单

2、一型检索工具、多元型检索工具 4、按照检索内容划分:综合型检索工具、专题型检索工具、特殊型检索工具,二、网络信息检索工具,查Usenet新闻组资源的WAIS 查FTP资源的Archie 查Gopher资源的Veronica 查Telent资源的Hytelent 查WWW资源Search Engine(搜索引擎)其中Search Engine 应用最为普及,主要搜索引擎的建立时间及网址,建立年月 搜索引擎的名称及网址 1994年4月WebCrawler http:/ 1994年5月Lycos http:/,1994年底Yahoo! http:/ 1995年初Infoseek http:/ 199

3、5年10月AltaVista http:/,第二节 搜索引擎及其检索 一、搜索引擎的构成及工作原理,用 户 检 索 策 略,搜索 引擎 用户 接口,搜索引擎本地的 摘要信息数据库,各万维 网站点 资源,访问,详细信息反馈,摘要信 息反馈,各记录链接,信息资源搜集,二、搜索引擎的功能,搜索引擎有两个主要的功能:1、收集网络信息资源,对其进行索引并建立数据库。2、提供网络的信息导航与检索服务(主要的功能)。,搜索引擎的基本检索功能,1、布尔逻辑检索逻辑与 (与、and、AND、 )A and B AB逻辑或(或、or、OR、|)A or B A;B;AB;逻辑非(非、not、NOT、!)A not

4、 B AAB,2、完全字符串检索采用双引号“”代表字符串精确查找“知识经济”知识经济,3、 截词检索(*)前方一致检索扩大检索范围nutri* nutria + nutrient + nutrilitei + nutriment + nutrition,4、字段限制检索 限定检索词在检索结果中出现的位置,用来控制检索结果的相关性。 如:URL限制(url:)主机名限制(host:)标题限制(title:),5、位置检索目前只有Alta Vista能提供邻近位置运算near运算。,6、 +、- 检索 +:放在检索词前,表示该检索词在检索结果中必须出现。 -:放在检索词前,表示该检索词在检索结果中

5、不能出现。 几乎所有的搜索引擎都支持这种功能。 如:+computer+virusCIH,搜索引擎的高级检索功能,1、自然语言检索 支持字、词、句子检索 几乎所有的搜索引擎都支持该功能 如:知识经济的支柱产业How has WTO developed?,2、模糊检索 当输入一个检索词时,搜索引擎会把与该检索词相关的词一并反馈,列出供用户选择。 相关性检索 如:在雅虎中国查找“搜索引擎”一词时,模糊检索会把“搜索引擎”、“搜寻引擎” 、“引擎”等相关的检索词一并列出。,3、概念检索用某一检索词进行检索时,能同时对该词同样或类似概念的同义词和近义词进行检索,以达到扩大检索范围,提高查全率的目的。如

6、:Excite,4、区分大小写检索 大多数搜索引擎在查询中要区分大小写 小写匹配大小写字符 大写只匹配大写字符,5、管道(|)检索用管道符(|)连接两个或者多个检索词,如 apple | disease,先对前一个检索词进行检索,再在其检索结果的基础上对后一个检索词进行检索,依次类推,以达到逐步缩小检索范围提高查准率的目的。,6、相关信息反馈检索提供与检索结果类似的检索结果。如:雅虎中国的“相关网站、相关网页、相关新闻”。Lycos的“More Like This”Excite的“Search for more documents like this one”,7、范围限制检索 在某一范围内检

7、索指定的检索词。分类范围、时间范围、地域范围、信息来源、检索词位置、语种范围、特殊范围,三、搜索引擎的分类,1、根据信息检索方式分类:分类搜索引擎、关键词搜索引擎、混合搜索引擎 2、根据信息覆盖范围及适用用户群分类: 综合性搜索引擎、专用性搜索引擎 3、根据搜索范围分类:独立搜索引擎、集成搜索引擎,四、搜索引擎常见的查询方式,按照搜索引擎提供的分类目录逐级 查询,用户一般不需要输入检索词, 而是按照查询系统提供的几种分类 项目,选择类别进行查询,这种方 式也叫分类检索。 用布尔逻辑组配方式查询,这种方式也 叫定制搜索。(多个关键词),五、搜索引擎检索的步骤,1、输入URL地址,登陆到搜索引擎的

8、主页。 2、输入检索提问式或点击分类目录,进行实时的交互式的信息检索。 3、搜索引擎输出HTML文件,并且翻译HTML,显示检索结果。,六、搜索引擎的选择技巧,查全率、查准率 更新速度、死链接 易用性、稳定性 搜索速度 高级搜索的支持能力,七、常用搜索引擎简介,1、主要中文搜索引擎 2、主要英文搜索引擎 3、各具特色的专用搜索引擎,主 要 中 文 搜 索 引 擎,百度是世界上规模最大的中文搜索引擎,拥有全球最大的中文网页库,每天处理来自一百多个国家的超过一亿人次的搜索请求。,百度高级搜索,主 要 中 文 搜 索 引 擎,一搜()是雅虎公司基于全球领先的YST(Yahoo Search Tech

9、nology)技术,在中国推出的搜索门户。一搜具有简洁专业、海量、客观精准、国际化、稳定高速等特点,是值得依赖的专业搜索门户。,主 要 中 文 搜 索 引 擎,主 要 中 文 搜 索 引 擎,一搜高级搜索,主 要 中 文 搜 索 引 擎,雅虎中国,主 要 中 文 搜 索 引 擎,雅虎中国高级搜索,主 要 中 文 搜 索 引 擎,新浪,主 要 中 文 搜 索 引 擎,搜狐,主 要 中 文 搜 索 引 擎,网易,主 要 中 文 搜 索 引 擎,主 要 中 文 搜 索 引 擎,263搜索,主 要 英 文 搜 索 引 擎,Alta Vista :http:/,主 要 英 文 搜 索 引 擎,Excit

10、e: http:/,主 要 英 文 搜 索 引 擎,Hotbot:http:/,主 要 英 文 搜 索 引 擎,Hotbot:http:/,主 要 英 文 搜 索 引 擎,Lycos:http:/,Google搜索引擎和百度搜索引擎,Google搜索引擎 百度搜索引擎,2.1 Google搜索引擎 网址:http:/ Google是一个全自动搜索引擎,它是利用计算机程序直接在网页中抓取相关字串。 “Google”一词来源于“googol”(仍然是英文) ,是10的100次方,表示是一个非常巨大的数字的概念。正如其名,Google是一个功能强大、使用方便的搜索引擎。,与其他搜索引擎相比Googl

11、e的优点: 1) 对于用户所输入的关键字,Google 会最大程度的寻求语义匹配。 例如想查找有关某人的网页,但输入“同音不同字的名” ,Google 也能找到你想要得信息。或者,在查询框中输入作者的名字,所有文章与网页都会被检索,连那个网页有转载都会显示出来。此外,Google 还包含有汉字的相关性 ,例如对中文简体网站,找出对应的繁体网站,甚至是日文网站。 2) Google还提供网页快照(Cached)功能。 Google将检索的网页都做了一番“快照”,然后存放在自己的服务器上,当被搜索的内容站点当前不存在时,用户可以用网页快照功能。,Google检索须知,当检索结果过多,需进一步缩小时

12、,可选择“缩小搜索”或在“结果中搜索”。只要输入更多的关键词即可,或在不需要的关键词前“-”号。注意“-”后应留一空格。 Google 不支持OR检索,也不区分英文大小写,所有字母均当小写处理。 在专用词语上加双引号可以进行精确查询,这在查找某个产品或专用术语时特别有用。,“-+=,”等也作为短语连接符。例如,尽管Micro-computer,不加引号,仍作为专用词语处理。 Google 会忽略http和com 等字样,以及数字和单字,因为他们出现过频繁,因此无助于检索,还会减低速度。 Google的“手气不错”功能将自动连接到Google推荐的网页,无需再查其他结果,快速方便,Google检

13、索示例,2.2 百度搜索引擎,网址:http:/,百度搜索引擎特点,1)中国人自己开发研制的,适合中文网站搜索 2)“网页的相关检索功能” 例如输入“手机”,在检索的上方还会出现“手机的价格”、“手机铃声”等与“手机”相关的词,此时再点一下“手机铃声”,则会检索出“手机铃声”的结果 3)在百度的检索结果中,用户可以选“重新查询”;也可选“在结果中再查”则将在第一次的结果中在按新输入的词查询,这相当于AND,结果会更精确些;选在“结果中去除”则将在第一次的结果中“减去”新输入的词查询,相当于NOT。,4)百度支持多关键词查询。关键词之间可用空格、逗号、+以及&符号,他们都代表AND,而竖线符号“|”代表OR,“-”仍然为NOT。在输入关键词前加“t:”将搜索网站标题(title),加“u:”则搜索网站地址URLs 。,百度搜索示例,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号