信息检索基本技术课件

上传人:我*** 文档编号:143688471 上传时间:2020-09-01 格式:PPT 页数:34 大小:608.50KB
返回 下载 相关 举报
信息检索基本技术课件_第1页
第1页 / 共34页
信息检索基本技术课件_第2页
第2页 / 共34页
信息检索基本技术课件_第3页
第3页 / 共34页
信息检索基本技术课件_第4页
第4页 / 共34页
信息检索基本技术课件_第5页
第5页 / 共34页
点击查看更多>>
资源描述

《信息检索基本技术课件》由会员分享,可在线阅读,更多相关《信息检索基本技术课件(34页珍藏版)》请在金锄头文库上搜索。

1、,第三章 信息检索基本技术,一、概述,从检索手段看,信息检索可分为手工检索和计算机检索。 手工检索使用的检索工具主要是印刷型(书本式)的检索工具; 计算机检索则运用现代通信技术、网络技术,利用光盘检索、联机检索、网络数据库、Internet网络检索等多种形式来获取信息。,检索手段 信息载体 存储方式 检索途径 检索策略实现 检索效率 手检 纸张 印刷型 较 少 人脑 低 机检 磁盘光盘等 电子型 较 多 计算机 高,二、 计算机检索,一)原理 计算机将输入机检系统的检索提问特征标识(检索词)或用布尔逻辑运算符(and、or、not)联结起来的检索提问式与已存储在系统中的文献特征标识(如:主题词

2、、分类号、作者姓名等)进行机械性匹配比较,凡符合给定的比较原则和逻辑运算条件者即为命中文献。,二)计算机检索特点,1. 内容广泛信息量大; 2 . 速度快,效率高; 3 . 检索途径多; 4 . 用户界面友好,使用方便; 5 . 资源更新快; 6 . 直接输出检索结果。,三) 计算机信息检索系统分类,按信息访问模式划分: 联机检索系统 光盘检索系统 网络数据库 Internet 网络检索,DIALOG,美国DIALOG系统是世界上最大的联机检索系统,该系统始建于1963年,原隶属于美国洛克希德导弹与宇航公司,于1972年正式向公众提供联机检索服务。 DIALOG系统目前已在全世界100多个国家

3、和地区拥有10余万个联机终端,数据库量已从最初的100多个发展为今天的600多个,数据库的内容涉及自然科学、社会科学、工程技术、人文科学、商业经济等各个领域,是一个综合性检索系统,其数据库数量之多、范围之广、用户之多均堪称世界之最。 Open Access ,DIALOG数据库的学科范围: DIALOG学科覆盖面广,几乎涉及全部学科范围包括综合性科学、自然科学、应用科学和工艺学,社会科学和人文科学,时事报道和商业经济等。其数据来源于各种不同的图书、报纸、杂志期刊、技术报告、会议论文、专著、专利、标准、报表、目录、手册等上的信息。 其数据形式包括:文献型文献的题录和文摘;数值型-统计表、商业财政

4、数据等;名录字典型-手册、指南、名录等;全文型-论文、报告、新闻报道的全文等。 DIALOG的数据库 CA(化学文摘)、INSPEC(英国科学文摘)、MEDLINE(医学文献数据库)、MATHSCI(数学文献数据库)、BA(生物学文摘)、NTIS(美国政府报告)等都加入到DIALOG系统中;还有著名的几大检索数据库,如SCI(科学引文索引)、EI(工程索引)、ISTP(科技会议录索引)、SSCI(社会科学引文索引)、AHCI(艺术与人文科学引文索引)等,三、步骤与方法 1、分析课题确定主题 2、选择数据库 1)收录文献的来源、学科特点 2)收录文献的文献类型和时间范围 3)收费标准及能否索取到

5、原文 3、选择检索词,4、制定检索策略 1)查找文献在类型、文种、时间等方面;2)进行概念分析、选择检索词;3)运用逻辑运算符、位置运算符、截词符等构造检索表达式;逻辑运算符:“OR”:逻辑或(和),用“+”表示,。 “AND”:逻辑与(积),用“*”表示。 “NOT”:逻辑非(差),用“-”表示。 “太阳”“能量”,练习,1、PATENT */+/- CHINA 2、在秦岭隧道中发表的有关掘进机和TBM的文章 3、除发表的有关秦岭隧道中掘进机和TBM的文章 KEYS: 2、(掘进机)秦岭隧道 3、(掘进机)秦岭隧道,COMPUTER NETWORKS (1) Applications (2)

6、 023065 (3) Computer information communication networks and expert systems.(4) Computerized data communication networks which provide data to users located as a distance from each other are considered. The possibilities of such communication networks for users of different professions are indicated,

7、and the advantages of this new information exchange technology are reviewed .(Author abstract)(5) 8 Refs.(6) In Russian.(7) Pahtavan,K (8)(Worcester polytechnic Inst).(9) Liefer ,Mark E. (11)ACM Trans Off Inf Syst v6 n3 Jul 1988 p277-302 (10),位置运算符: (w)算符With: (w)要求检索词必须按指定顺序紧密相连,词序不可变,词之间除允许有空格、标点、

8、连字符外,不得夹单词或字母;(Nw)表示连接的两个词之间最多可夹入N个词(N为自然数),词序不得颠倒 例如: input(w)output input output ;input, output ;input-output wear(1w)materials wear materials、wear of materials 。,(n)算符near: (n)要求被连接的检索词必须紧密相连,词之间除允许有空格、标点、连字符外,不得夹单词或字母,词序不限;(Nn)表示两个检索词之间最多可以夹N个词(N为自然数1、2、3),且词序任意。 例如:information(n)retrieval infor

9、mation retrieval 、 retrieval- information, economic(2n) recovery economic recovery、recovery from economic troubles,、 building (w) construction 2、 building (1w) construction 3、 building (n) construction Keys: 、 building construction; building- construction 2、 building and construction; building under

10、 construction 3、 construction building; Construction- building,截词符 无限截词符“*”,代表零至无数多个字母; computer*computer;computered ;computering; 有限截词符“?”,只能代表一个字母; teen? teens 例如: *chemi* chemical、chemist、chemistry、electrochemistry、electrochemical、physicochemical、thermochemistry,1、ne?t 2、查找检索结果为”Zhejiang Univ Tec

11、hnol”的文献 Keys: 1、neat;nest;next 2、Zhejiang and Univ* and Tech*, 限制检索(Range) 1)字段检索: 1、基本索引字段:描述文献内容特征的字段,一般用后缀形式表示。 /AB ABSTRACT 文摘 /DE DESCRIPTOR 叙词 /ID IDENTIFIER 自由标引词 /TI TITLE 篇名 例如查找微型机和个人计算机方面的文章。要求“微型机”一词出现在叙词字段、标题字段或文摘字段中,“个人计算机”一词出现在标题字段或文摘字段中 microcomputer*/de,ti,abOR(personal computer)/t

12、i,ab,2、辅助索引字段:描述文献外部特征的字段,检索时辅助索引字段代码置于检索词之前,一般不单独使用,常与基本索引字段配合使用。 AA= AUTHOR AFFILIATION 著者单位 AD= APPLICATION DATE 专利申请日 AN= ABSTRACT NUMBER, 文摘号 APPLICATION NUMBER 专利申请号 AU= AUTHOR OR INVENTOR 著者或发明者 PY= PUBLICATION YEAR 出版年 CY= CONFERENCE YEAR 会议年份,例如查找微型机和个人计算机方面的文章。要求“微型机”一词出现在叙词字段、标题字段或文摘字段中,“

13、个人计算机”一词出现在标题字段或文摘字段中 。要查找1999年出版的英文或法文的微型机或个人计算机方面的期刊 ( (microcomputer)/de,ti,ab OR (personal computer)/ ti,ab)AND PY1999 AND(LAEN OR FR)AND DTSerials,4.进行查找、检出相关文献并分析检索结果;5.对检索式进行反馈修改 。,四、检索实例 1、“心脏病与吸烟之间的联系” (英文) 2、门式起重机的研究 3、西红柿的病虫害预防与养殖 、搜索计算机行业的营销状况,但不需要查询方正计算机的营销状况 、查找年的文献 、查找杜彦良发表的有关掘进机和的文章

14、、查找除了石家庄铁道学院发表的有关掘进机和的文章,1、(HEART(5N)DISEASE +HEART(5N)ATTACK)*(SMOK*+TOBACCO) 2、门式起重机门式*起重机 3、(番茄+西红柿)*(病虫害*预防+养殖) 、(计算机营销)方正 、:; 、作者杜彦良 (题名掘进机题名) 、(题名掘进机题名) 机构石家庄铁道学院,五、 Internet 网络检索,一) Internet基本概念 Internet是国际互联网, 也称因特网,它是一个计算机网络的网络。Internet将世界上不计其数的计算机及计算机网络互联起来,它们共同遵循TCP/IP 通讯协议。Internet是信息高速公

15、路的原形。,(1)中国科技网CSTnet (2)中国教育科研网CERNET,(3)中国公用计算机互联网CHINANET (4)中国金桥信息网,,二)搜索引擎概述,搜索引擎(Search Engines)是指对WWW站点资源和其他网络资源进行标引和检索的一类检索系统机制。 搜索引擎最根本的任务是向网络访问者提供一个高效的访问机制。搜索引擎本身是个网站,但搜索引擎的数据库中存放的是其他网站的信息,而不是自己的信息。搜索引擎不仅接受用户的访问,还根据用户的搜索要求,在庞大的数据库中搜索出满足用户需要的站点。,搜索引擎常用的检索方法有关键词检索和目录浏览两种形式。 关键词检索:用户直接输入检索词,搜索

16、引擎通过查找索引数据库中包含有检索词的记录来提供用户所需的信息资源。检索方便直接,而且可以使用逻辑算符、位置算符、截词符等来构成检索式,可以限制检索对象的地区、数据类型、时间等,因而可准确检索满足特定条件的网络资源。 目录浏览:用户通过浏览层次型的目录来寻找相关的信息资源。目录按一定的主题分类体系组织,并辅之年代、地区等分类。用户一般采取逐层浏览目录、逐步细化来寻找合适的类别直至具体资源。 检索和浏览在信息查询过程中各有其功用。一般地说,检索便于有的放矢,直接获取检索结果;浏览利于边查边看,发现未曾预料的结果。,(三)几种常用的搜索引擎,1.一种典型的搜索引擎介绍ahoo! (1)分类浏览 (2)关键词检索 在检索输入框中直接输入检索词或词组,Yahoo!将在索引数据库中进行检索。 中文yahoo() 中文yahoo则是yahoo为中文用户开发的中文网站查询系统,它收集了数以万

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号