Five搜索引擎及国际联机检索

上传人:jiups****uk12 文档编号:56933281 上传时间:2018-10-17 格式:PPT 页数:56 大小:626KB
返回 下载 相关 举报
Five搜索引擎及国际联机检索_第1页
第1页 / 共56页
Five搜索引擎及国际联机检索_第2页
第2页 / 共56页
Five搜索引擎及国际联机检索_第3页
第3页 / 共56页
Five搜索引擎及国际联机检索_第4页
第4页 / 共56页
Five搜索引擎及国际联机检索_第5页
第5页 / 共56页
点击查看更多>>
资源描述

《Five搜索引擎及国际联机检索》由会员分享,可在线阅读,更多相关《Five搜索引擎及国际联机检索(56页珍藏版)》请在金锄头文库上搜索。

1、第五章 搜索引擎及国际联机检索,主要内容,5.1 搜索引擎5.2 国际联机检索,5.1 搜索引擎,1、网络信息资源检索概述 2、基于搜素引擎的网络信息检索 3、常用的搜索引擎介绍 4、使用搜索引擎的相关问题及发展趋势,5.1 搜索引擎,1、网络信息资源检索概述 (1)网络信息检索特点 1)交互式作业方式 2)用户透明 3)信息检索空间的拓宽 4)友好的用户界面操作方便,5.1 搜索引擎,1、网络信息资源检索概述 (2)网络信息检索的进入方式 从方法上来看,用户访问WWW系统,搜索和利用网络信息资源的方法有两种: 1)已知URL地址的查找方法 2)未知URL地址的查找方法,5.1 搜索引擎,1、

2、网络信息资源检索概述 (3)网络信息检索工具的类型 1)按检索机制划分 分类目录检索工具 搜索引擎型检索工具 混合型检索工具,5.1 搜索引擎,1、网络信息资源检索概述 (3)网络信息检索工具的类型 2)按检索内容划分 综合型检索工具 专题型检索工具 特殊型检索工具,5.1 搜索引擎,1、网络信息资源检索概述 (3)网络信息检索工具的类型 3)按包含检索工具数量划分 单独型检索工具:拥有独立的网络资源采集标引机制和相应的数据库。 多元型检索工具:是一种能够利用多个检索工具进行网络信息查询的检索工具,它通过一个统一用户界面帮助用户在多个检索工具中选择和利用合适的检索工具来实现检索操作。,5.1

3、搜索引擎,1、网络信息资源检索概述 (3)网络信息检索工具的类型 4)按检索资源类型划分 万维网检索工具:主要检索万维网站点上的资源。 非万维网检索工具:主要检索特殊类型的信息资源,如:检索FTP文件的Archie、FileZ和T等。,5.1 搜索引擎,2、基于搜素引擎的网络信息检索 (1)搜索引擎概述 1)搜索引擎的基本类型 按分类检索:Yahoo、Infoseek、Galaxy、GNN等。 按检索词检索:Webcrawler、Lycos、Alta Vista、excite、Open-Text,5.1 搜索引擎,2、基于搜素引擎的网络信息检索 (1)搜索引擎概述 2)搜索引擎的工作原理 搜索

4、引擎一般主要由搜索软件、索引软件和检索软件三部分组成。 信息的采集和存储 信息索引的建立 检索界面的建立 搜索结果的相关性处理,5.1 搜索引擎,2、基于搜素引擎的网络信息检索 (2)搜索引擎的技术分析 1)搜索引擎的Robot技术分析 2)搜索引擎的索引技术分析 3)搜索引擎的接口技术分析,5.1 搜索引擎,3、常用的搜索引擎介绍 (1)常用的单个搜索引 1)Alta vista-http:/ Excite-http:/ Lycos-http:/,5.1 搜索引擎,3、常用的搜索引擎介绍 (1)常用的单个搜索引 1)Alta vista-http:/ Excite-http:/ Lycos-

5、http:/,5.1 搜索引擎,3、常用的搜索引擎介绍 (2)多元搜索引擎概述可以在不降低系统效率的前提下,把多个 搜索引擎的检索结果综合起来,从中选取与用户查询相关度较大的,排除掉重复的和相关度较低的检索结果,并将检索结果以统一的界面呈现给用户。,5.1 搜索引擎,3、常用的搜索引擎介绍 (2)多元搜索引擎概述 1)基本体系结构 (1)用户接口部分:指用户的浏览器和多元搜索引擎系统交互的界面,任务是接收用户的查询要求,生成适用于不同独立搜索引擎的特定请求。 (2)查询代理部分:指多元搜索引擎和相应的单元搜索引擎的交互,以获得用户需要的查询结果。其中,包括查询、网页分析、汇总输出并调整。,5.

6、1 搜索引擎,3、常用的搜索引擎介绍 (2)多元搜索引擎概述 2)工作原理多元搜索引擎实际上是一种网络查询接口工具。用户向多元搜索引擎发出检索请求,它将该请求整理为相应的检索指令发往多个单搜索引擎。给单搜索引擎执行检索指令后将检索结果传送给多元搜索引擎,经过整理后再传送给用户。,5.1 搜索引擎,3、常用的搜索引擎介绍 (2)多元搜索引擎概述 3)主要功能 搜索引擎的选择 功能较强的多元搜索引擎一般能采用并行和串行处理相结合的方式 检索指令的转换 检索结果的转换 查询操作大多仅支持简单的布尔逻辑运算 查询界面逐渐致力于满足用户进行查询操作的个人特制化要求。,5.1 搜索引擎,3、常用的搜索引擎

7、介绍 (2)多元搜索引擎概述 4)多元搜索引擎的类型 按照工作方式可以分为两大类:并行处理串行处理,5.1 搜索引擎,3、常用的搜索引擎介绍 (2)多元搜索引擎概述 5)多元搜索引擎的优势 由于没有网页索引数据库的建立和维护,多元搜索引擎可以集中更多的精力和财力完善检索要求的分发和检索结果的技术处理。 同时链接多个独立的搜索引擎,并充分使用数据库,因而避免在多个系统之间的切换及重复输入查询要求,特别是一些采用并行处理方式的多元搜索引擎,查询的速度也会更快。 使用多元搜索引擎可以省却各个独立搜索引擎在检索语法、指令差异,可由系统为用户统一处理检索的规则、语法和指令。 多元搜索引擎可以很方便地配置

8、客户端,用户可以按照自己的习惯配置成具有个人风格的WEB查询工具。,5.1 搜索引擎,3、常用的搜索引擎介绍 (2)多元搜索引擎概述 6)多元搜索引擎的评价与选择 是否允许用户浏览并选择要调用的独立搜索引擎。 是否覆盖多种区资源类型,是否可提供主题范畴的目录服务。 是否支持逻辑匹配检索、短语检索、自然语言检索等高级检索特性,是否能够实现检索请求的“本地化”转换。 是否提供了足够多的检索选项和功能设置。 是否提供多种检索结果输出格式,检索结果的信息描述是否全面等。,5.1 搜索引擎,3、常用的搜索引擎介绍 (2)多元搜索引擎概述 7)多元搜索引擎的局限性 检索性能的局限性。 调用搜索引擎的局限性

9、。 是否支持逻辑匹配检索、短语检索、自然语言检索等高级检索特性,是否能够实现检索请求的“本地化”转换。 是否提供了足够多的检索选项和功能设置。 是否提供多种检索结果输出格式,检索结果的信息描述是否全面等。,5.1 搜索引擎,3、常用的搜索引擎介绍 (3)常用多元搜索引擎介绍 1) Mamma ( http:/)1996年面世,自称为“搜索引擎之母”的并行元搜索引擎,可同时调用7个最常用的独立搜索引擎,并且可查询网上商店、新闻、股票指数、图像和声音文件等资源。 其特点是检索界面友好,检索选项丰富,主要包括:可控制调用的独立搜索引擎、选择使用短语检索功能、设定检索时间、设定每页可显示记录数等。 另

10、外,Mamma支持常用检索语法在不同搜索引擎中的转换,还提供了专门检索页面文件标题的特殊检索服务,以及通过Email传输检索结果的特色功能。 检索结果以相关性排序,内容包括网页名称、URL、文摘、源搜索引擎,Mamma主页,5.1 搜索引擎,3、常用的搜索引擎介绍 (3)常用多元搜索引擎介绍 2)ASK Jeeves 3) Search ,ASK主页,Search主页,5.1 搜索引擎,3、常用的搜索引擎介绍 (3)常用多元搜索引擎介绍 4) MetaCrawler 1995年由华盛顿大学推出,1997年被InfoSpace购买。支持调用12个独立搜索引擎,提供涵盖近20个主题的目录检索服务。

11、其检索特性非常丰富,包括常规检索、高级检索、定制检索、国家或地区的资源检索等检索服务模式。,MetaCrawler主页,5.1 搜索引擎,3、常用的搜索引擎介绍 (3)常用多元搜索引擎介绍 5)Profusion 6) ByteSearch ,其他著名元搜索引擎,Ithaki ( http:/ 支持包括中文在内的14种语言检索 Ixquick ( http:/ 可搜索网站、MP3、新闻、图象等多种网络资源 InfoGrid ( http:/ 提供与主要搜索网站的直接连结和目录检索,具有强大的元搜索和新闻搜索功能SavvySearch ( http:/savvy.cs.colostate.edu

12、:2000/) 支持二十种语言(不包括中文),可调用全部或任意几个搜索引擎,可选择每个搜索引擎返回结果的数目,可进行目录检索,5.1 搜索引擎,4、使用搜索引擎的相关问题及发展趋势 (1)使用搜索引擎的相关问题 1)使用搜索引擎的主要要点 2)使用搜索引擎的主要事项 3)搜索引擎的检索策略 4)搜索引擎的检索技巧,5.1 搜索引擎,4、使用搜索引擎的相关问题及发展趋势 (2)使用搜索引擎的发展趋势 1)搜索引擎技术的最新研究 在使用智能代理技术跟踪用户检索行为。 采用人工智能技术,不断地分析用户的检索行为。 采用集中式体系结构和分布式体系结构,以提高系统性能。使用交叉语言信息检索,让用户能在母

13、语检索词的背景下,能检索到所有语言的检索结果。,5.1 搜索引擎,4、使用搜索引擎的相关问题及发展趋势 (2)使用搜索引擎的发展趋势 2)搜索引擎的最新技术发展内容 提高了搜索引擎对用户检索提问的理解 提高了对检索结果的处理能力,5.1 搜索引擎,4、使用搜索引擎的相关问题及发展趋势 (2)使用搜索引擎的发展趋势 3)搜索引擎的研究发展方向 智能化搜索 个性化搜索 结构化搜索 垂直化专业领域搜索 本土化的搜索,5.2 国际联机检索,1、联机检索系统 2、国际联机检索:Dialog联机检索系统 3、国际联机检索:OCLC的FirstSearch联机检索系统,5.2 国际联机检索,1)联机检索,就

14、是人们将终端设备通过通信网络与计算机检索系统相联,采用人机对话方式,从主机中查找所需信息的过程. 2)联机检索的主要步骤 与主机系统联机,并输入用户号和密码。 使用选库指令进入数据库。 输入检索式,开始进行检索。 打印检索出来的记录内容。关机,结束检索。,5.2 国际联机检索,1、联机检索系统 (1)联机检索系统的结构 包括检索终端、通信网络和联机检索中心三个部分。 (2)国际联机系统 国际联机检索中数据库系统在国外的,检索结果可提供国外文献信息。 四大国际联机检索系统:DIALOG、ORBIT、ESA-IRS、DATA-STAR,5.2 国际联机检索,2、国际联机检索:Dialog联机检索系

15、统美国DIALOG是目前世界上最强大的国际联机检索系统,所拥有的近600个联机数据库都是质量很高、权威的数据库。DIALOG现有60亿页文字信息和300万个图像象文件共9万亿字节的文字信息量,是目前万维网上信息量的50倍。其内容涉及40多个语种和占世界发行总量的60%的6万多种期刊。DIALOG数据库信息量大,检索方式灵活,适用于做比较全面的文献调研检索。如:科研课题开题立项时进行文献回溯检索、课题中期跟踪检索和课题结题时的查新检索等。,5.2 国际联机检索,2、国际联机检索:Dialog联机检索系统DIALOG学科覆盖面广,几乎涉及全部学科范围,包括综合性科学、自然科学、应用科学和工艺学、社

16、会科学和人文科学、时事报道和商业经济等。其数据来源于各种不同的图书、报纸、杂志期刊、技术报告、会议论文、专著、专利、标准、报表、目录、手册等上的信息。其数据形式包括:文献型文献的题录和文摘;数值型统计表、商业财政数据等;名录字典型手册、指南、名录等;全文型论文、报告、新闻报道的全文等。,5.2 国际联机检索,2、国际联机检索:Dialog联机检索系统DIALOG的近600个数据库中有许多极具代表性的和常用的数据库,著名的数据库如INSPEC、MEDLINE、MATHSCI、BA、NTIS等都加入到DIALOG系统中;还有著名的几大检索数据库,如SCI、EI、ISTP、SSCI、AHCI(艺术与人文科学引文索引)等也都可从DIALOG系统中检索;再有世界著名的DERWENT专利数据库以及美国专利、欧洲专利、日本专利等数据库也都可在DIALOG中查询。DIALOG更有一些全文数据库,如IAC的计算机全文库、纽约时报和华盛顿邮报等的全文库等。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号