第五章网络信息检索工具

上传人:宝路 文档编号:48609021 上传时间:2018-07-18 格式:PPT 页数:86 大小:10.17MB
返回 下载 相关 举报
第五章网络信息检索工具_第1页
第1页 / 共86页
第五章网络信息检索工具_第2页
第2页 / 共86页
第五章网络信息检索工具_第3页
第3页 / 共86页
第五章网络信息检索工具_第4页
第4页 / 共86页
第五章网络信息检索工具_第5页
第5页 / 共86页
点击查看更多>>
资源描述

《第五章网络信息检索工具》由会员分享,可在线阅读,更多相关《第五章网络信息检索工具(86页珍藏版)》请在金锄头文库上搜索。

1、第五章 网络信息检索工具 5.1网络信息检索工具概述 5.2 搜索引擎 5.3著名全文型搜索引擎介绍 5.4著名目录型搜索引擎介绍 5.5著名元搜索引擎介绍 5.6 搜索引擎使用技巧 5.7搜索引擎的不足第五章 网络信息检索工具 5.1网络信息检索工具概述 5.1.1网络信息检索工具定义: 因特网上提供信息检索服务的计算 机系统,其检索的对象是存在于因特 网信息空间中各种类型的网络信息资 源 .5.1网络信息检索工具概述 5.1.2网络信息检索工具的类型按检索网络资源的类型1、Web检索工具(search Engine即搜索引擎) 主要检索万维网站点上的资源,以网页的形式提供检索结果。 2、非

2、Web检索工具:非万维网检索工具指主要检索特殊类型的信息资源,这 类检索工具随着WEB资源的 崛起,作用已经大大削弱。5.2 搜索引擎 5.2.1搜索引擎(search Engine,即Web检 索工具)1、定义:指以人工或网络机器人软 件的方法采集、标引Web资源和其他 类型的网络资源,并将索引信息内容 利用超文本技术存储于大型数据库中 ,在因特网上建立的一种提供网上信 息资源导航、检索服务的专门Web服 务器或网站。5.2 搜索引擎 5.2.1搜索引擎(search Engine,即Web检 索工具) 从广义的角度上讲搜索引擎是因特网上 专门提供检索服务的一类网站。通过在Web上主 动搜寻

3、信息(搜索网页上有意义的单词和简短的 对特定内容描述的词),对这些信息自动标引, 并将标引的内容储存在可供检索的大型数据库中 并对用户提出的各种检索做出响应,来提供用 户所需的信息或相关的指针。5.2 搜索引擎 5.2.1搜索引擎 自动索引程序 2、搜索引擎的构成 索引数据库 检索代理软件 点击这些文件 搜索引擎 均无法获得5.2 搜索引擎 5.2.2搜索引擎的类型 1、按搜索机制划分 全文(关键词型)搜索(Full text search)引擎 目录(分类式)(Directory)搜索引擎 混合型搜索引擎 2、按搜索内容划分 综合型 专业型 特殊型全文型引擎google全文型引擎Baidu目

4、录式引擎yahoo!混合型引擎yahoo!5.2 搜索引擎 5.2.2搜索引擎的类型 3、按包含搜索工具的数量划分 单独型搜索引擎(只能在本搜索引擎的数据库中检索 ) 集成型搜索引擎(也称为元搜索引擎) 集成型搜索引擎是指个搜索引擎包含多个单搜索 引擎利用集成型搜索引擎,就可以把输入的关键词同时 提交到多个搜索引擎站点上进行检索,然后把检索结果 集中整理后再反馈给用户,与单独型搜索引擎相比。集 成型搜索引擎没有自己独立的数据库,它只是提供了一 个统一界面,把多个具有独立功能的搜索引擎组合起来 。元搜索引擎5566点击元搜索引擎hao1235.4著名目录型搜索引擎介绍5.4.1 Yahoo(ht

5、tp:/ Filo 共同创建了举世闻名的Yahoo。将因特网上他们 感兴趣的网站按主题分类收录,分入14个不同的 类目,数据由人工录入,并对收录的每个网站进 行了相关的介绍,这就是最原始的Yahoo。Yahoo除了提供列表式目录链接浏览外,还 提供关键词检索。它的关键词检索可以提供简单 检索和高级检索,检索时,可以利用双引号、限 定检索等。http:/ 点击5.4著名目录型搜索引擎介绍 5.4.2搜狐(http:/ 1、分类体系:18个基本大类,涵盖了50000多个不同层 次的子类目,形成了一个十分庞大的树状结构,几乎涉 及所有的行业或者领域。搜狐网络资源目录收录的网站 资源都经过了搜狐分类编

6、辑们严格的审核和筛选,质量 比较高。查询时按照信息所属的类别,层层点击查找信 息,所以用目录时首先要考虑清想要查找的信息属于哪 个类别。 2、关键词检索提供简单检索和高级检索两种形式。 (1)简单检索:在搜索框中直接输入自己想查找信息的 关键词,找到相关信息。这种方法对网站、网页、新闻 、类目、黄页、软件等都适用。 (2)高级检索:通过选择“所有输入的关键词”和“至少其 中一个关键词”来分别完成逻辑“与”和逻辑“或”的运算5.4著名目录型搜索引擎介绍(3)检索结果的类聚方式:内容类聚:指同一个内容的网页只出现一次,它屏 蔽掉了同样内容的网页,只提供其中一个URL供用户浏 览使用。站点类聚:只给

7、用户提供相关网站的主页的URL, 屏蔽掉了同一网站中各逐步形成不同的页面。默认选择为“站点类聚及内容类聚”(4)时间限制:指定查询结果中网页的生成时间,它包 括四种选择“任何时间的网页”(默认选择)、“三个月 内的网页”、“六个月内的网页”、“一年内的网页”5.4著名目录型搜索引擎介绍5.4.3蓝帆(http:/ 数已达16000多条。蓝帆中文目录检索系统除以分类浏览为特色外,还 提供关键词检索,拥有网站搜索、网页搜索、新闻搜索 、人才搜索、职位搜索、比价搜索、打折搜索、餐厅搜 索、食谱搜索等多项搜索功能。 四、Open Directory(http:/dmoz.org/) 五、LookSma

8、rt(http:/) 六、Galaxy(http:/) 七、The WWW Virtul Library(http:/www.vlib.org/)5.3著名全文型搜索引擎介绍 5.3.1中文Google(http:/)1、Google支持中文搜索,2000年9月推出。2、检索功能强大。(1)布尔逻辑组配。逻辑“与”操作:用“+”或空格来表示。逻辑“或”操作:用大写的“OR”表示,且“OR”的两边不得有空 格。(2)限制检索。“site:”表示对搜索的网站进行限制。例如: “图书馆site:http:/”、“in url:”、“in title”(3)图像搜索。进入图像搜索界面 http:/,用

9、户可以在搜索框内输入描述图像 内容的关键字。(4)新闻组搜索。Google的限制检索试 讲 人:王 鑫申报课程:图书情报文献学Google,我们真的熟悉吗?Google,奇妙的特殊检索!利用Google进行检索site:filetype:inurl:intitle:检索表达式:关键词site:域名site:域名 关键词把检索结果限制在某个具体网站或者某个域名之内。 例如:“图书馆site:http:/”,查找出中央电视台 网站上关于“图书馆”的信息。site:检索图书馆 site:http:/“中央电视台”网站 中 含有“图书馆”一词 的网页查询某一特定文件格式的信息资源,使用filetype

10、进行检索就可 以满足需求 。检索表达式:filetype:文件类型 关键词 常用文件格式:pdf、ppt、doc、xls、mdb例如:“filetype:pdf 数字图书馆”能检索出有关“数字图书馆”的 PDF格式的资源,用户可以直接对检索结果进行浏览。filetype:检索含有“数字图书馆” 关键词的PDF格 式的信息资源要检索的关键词包含在网页标题之中。用intitile检索网页标题栏 会找到相关度较高的网页。 检索表达式:intitle:关键词 例如:“intitle:竞争情报与知识管理”可以检索网页标题栏中含有 “竞争情报与知识管理”的相关页面。intitle:检索网页标题中含有“竞

11、争情报与知识管理”Google中的限制检索在其他搜索引擎中是否 同样适用呢?相关思考点击逻辑非逻辑或词组逻辑与限制检索点击5.3著名全文型搜索引擎介绍5.3.2 百度( http:/ 2、支持多种检索功能。(1)支持“+”(AND)、“-”(NOT)、“|”( OR)(2)提供相关检索功能。(3)提供限定检索“link:”、“intitle:”、 “inurl:” 3、特色功能,如mp3搜索、Flash搜索检索的关键词包含在URL(Uniform Resource Locator)链接 中。用inurl进行检索可以得到非常精确的专题信息。检索表达式:inurl:关键词 例如:“inurl:re

12、trieval”,在URL中含有“retrieval”的页面inurl:检索inurl:retrieval点击url中含有“retrieval” 的网页检索的关键词包含在URL(Uniform Resource Locator)链接 中。用inurl进行检索可以得到非常精确的专题信息。检索表达式:inurl:关键词 关键词 例如:“inurl:retrieval 信息检索”,在URL中含有“retrieval”的并且网页中还含有“信息检索”一词的所有信息inurl:检索inurl:retrieval 信息检索点击网址中含有“retrieval”一词页面内容中含有 “信息检索”一词 的网页5.4

13、.3 天网( http:/) 1、于1997年正式在Cernet上向用户提供 Web信息导航服务。 2、支持布尔检索 3、FTP搜索 4、天网目录可查询网页 5、主题搜索。5.3著名全文型搜索引擎介绍 5.3.4万维搜索5.3著名全文型搜索引擎介绍5.3.5其它重要全文型搜索引擎 1、Alta Vista(http:/) 2、Lycos(http:/) 3、Fast/AllTheWeb(http:/) 4、Excit(http:/) 5、Infoseek(http:/) 6、慧 聪(中国搜索)(http:/) 7、网络指南针(http:/:8010) 8、新浪搜索引擎(http:/ 9、网易(

14、http:/)5.5著名元搜索引擎介绍5.5.1好用的5566(http:/)点击重启生效5.5著名元搜索引擎介绍 5.5.2 好123(http:/ 搜索引擎使用技巧 1、熟悉经常使用的查询工具及其特性是搜索成 功的基础 2、确定使用哪一类搜索引擎,这是信息检索关 键的一步。 一般地如果用户查询的主题不太明确不 能准确地确定搜索的是什么或搜寻的主题范围很 广或概念很宽泛时,采用目录式搜索引擎 如果主题范围较狭小、有特定主题,或者是 要获取有关交叉性、细节性问题的信息,检索时 采用全文搜索引擎、例如想了解澳门大学.5.6 搜索引擎使用技巧 3 利用元搜索引擎可以提高查全率4 关键字的选择是运用搜索引擎成功的重要因素应选择与检索主题相关的尽可能多而且精确的 检索词 1)找出所有与课题有关的关键词及其同义词2)选择最精确的关键词3)避免使用禁用

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号