文献检索授课内容4(计算机)课件

上传人:我*** 文档编号:141800446 上传时间:2020-08-12 格式:PPT 页数:25 大小:173KB
返回 下载 相关 举报
文献检索授课内容4(计算机)课件_第1页
第1页 / 共25页
文献检索授课内容4(计算机)课件_第2页
第2页 / 共25页
文献检索授课内容4(计算机)课件_第3页
第3页 / 共25页
文献检索授课内容4(计算机)课件_第4页
第4页 / 共25页
文献检索授课内容4(计算机)课件_第5页
第5页 / 共25页
点击查看更多>>
资源描述

《文献检索授课内容4(计算机)课件》由会员分享,可在线阅读,更多相关《文献检索授课内容4(计算机)课件(25页珍藏版)》请在金锄头文库上搜索。

1、计算机检索的原理图示,数据库(文档) 文献记录 计算机 用户提问 查出文献,数据库的类型,1、文献型数据库:也称为书目数据库或目录数据库,是二次文献数据库。 2、指南数据库:也称指示性数据库,其内容是关于某些机构、人物、出版物、项目、程序、活动等对象的简要描述,是指引用户从其他有关信息源获取更详细的信息的一类数据库。 3、数值数据库:又称数据型数据库,主要是储存数据信息。 4、全文数据库:是指储存文献全文或者其中主要部分的一种数据库,计算机检索基本技术,计算机检索式(逻辑表达式): 检索词+有关算符,计算机检索策略的构建,(1)布尔逻辑检索(boolean logic): 是当今检索理论中最成

2、熟的理论之一,也是构造检索表达式最基本、最简单的匹配模式。布尔逻辑检索是通过布尔逻辑算符来实现的,这些运算符能把一些具有简单概念的检索词(或检索项)组配成为一个具有复杂概念的检索式,用以表达用户的检索要求。,布尔逻辑算符: 逻辑“与”“AND” * 逻辑“或” “OR” + 逻辑“差”“NOT” - ( ),优先级运算: ()NOTANDOR,(2)位置算符(又称邻接算符),1/ “(W)”含义为“With” 这个算符表示两侧的检索词必须紧密相连,除开空格外和标点符号外,不得插入其他词或字母,两词的词序不可以颠倒。 另外“(W)”还可以使用其简略形式“()”。,举例说明,检索策略为: COMM

3、UNICATION(W)SATELLITE” 或“communication()satellite” 系统将只检索含有communication satellite 词组的记录。,2/ “(nW)” 含义为“Word” 它允许两词间插入最多为n个其他词,包括实词和系统禁用词,词序不变。 如:“COMMUNICATION(2W)SATELLITE”时,系统将只检索含有communication satellite,communication though satellite,communication in the satellite,3/ “(N)”含义为“Near” 这个算符表示两侧的检索词

4、必须紧密相连,除空格和标点符号外,不得插入其他词或字母,两词的词序可以颠倒。 “(nN)”是(N)算符的变形,不同之处为允许两词间插入最多为n个其他词包括实词和系统禁用词。,举例说明,检索策略为: “COTTON(2N)PROCESSING”时, 凡含有cotton processing,processing of cotton和processing of Egyptian cotton的文献记录都算命中。,4/ “(F)”含义为“Field” 这个算符表示其两侧的检索词必须在同一字段(如同在题目字段或文摘字段)中出现,词序不限,中间可插任意检索词项。 如:检索策略:POLLUTION(F)C

5、ONTROL 可查出control and management of industrial pollution一检索词在同一题目字段中。,5/ “(S)”含义为“Sentence” 这个算符表示其两侧的检索词必须在同一句子(子字段)中出现,两词的词序可以颠倒。 如:检索策略:COMMUNICATION(S)SATELLITE 将检出含有communication satellite和satellite communication词组的记录。,(3)字段限制,1/ 基本字段用法: 是在需要指定字段的检索词后加上后缀运算符“/”和段码。 如:OPTICAL/TI AND FIBER/TI 常用后

6、缀代码和检索例子: /TI篇名;如:S control(w)pollution/ti /DE叙词;如:S aluminum compounds/de /ID标引词;如:S soap/id /AB文摘词;如:S computer/ad,2/ 辅助字段用法: 是在需要指定字段的检索词(有时检索词须放在双引号内)之前加上段码和前缀运算符“=” 如:AU=“Robert,S.”,其他常用的辅助字段: AU作者字段 CS著者单位字段 如:CS=JIAO TONG UNIVERSITY JN刊物名称字段 如:JN=APPLIED PHYSICS LA语言字段 如:LA=ENGLISH PY年代字段 如:P

7、Y=1999,注意:目前各个检索系统所设立的字段是各不相同的,即同一字段,也可能采用不同的字段代码表示。 如题名字段:Ei CPX Web 中, 用 highway transport* within TI 来表示; OCLC Firstsearch 中,用 TI: highway transport* 来表示。 在进行字段检索时,为了避免出现检索误差, 应先看一下该数据库的使用指南或说明。,(4)截词算符,它是使计算机保留检索词的相同词干部分,允许检索词可有一定范围的变化。 截词符一般有“?”、“+”(不同数据库有不同的截词符) 截词有四种形式: 前方一致:如“Textile?”可同时查出含

8、有Textile和Textiles的文献。 后方一致:如“?polymer”可同时查出含有Homopolymer, Copolymer文献。 中间一致:如“?Wave?”可同时查出含有WAVES, microwave等的文献。 中间屏蔽:如“Fib?s”相当于查出含有Fibers和Fibres的文献。,使用截词应注意的几个问题,一、截词符要紧接在词干后面,截词符和词干之间不能有空格。 二、避免将检索词的词干截得过短,一般应在三个字母以上。 三、截词应该使用得合理。一般不可能出现词尾变化的单词,其后不必再使用截词。 四、从希望出现的单词中取尽可能多的公共字母作为词干,以提高查准率,禁用词表,在西

9、文数据库中,系统对信息进行标引时,不能做标引词或检索词的语词 包括“介词、冠词、代词、连接词、某些形容词或副词”等 如a、and、for、in、she、should、the、well、only,如何提高查全率,选择上位词和相关词;如:查找关于孙中山的文献,先用孙中山查,再用孙文、国父查找。 调节检索式的网罗度,删除不必要的组面,如and(并且); 进行族性检索(分类检索或用or连接相关检索词); 截词检索;comput*代替computer,如何提高查准率?,提高专指度(用下位词或换专指性强的自由词) 用逻辑算符and 或 not连接相关检索项;如查找克林顿,但不要关于莱温斯基的信息。检索式:

10、克林顿 not 莱温斯基 用文献外部特征限制输出结果(在中文图书中查找); 用“二次检索” 排除误检; 限制检索字段,指定邻接和优先关系。,计算机检索的特点,检索速度快 检索途径多 更新快 资源共享 检索更方便灵活 检索结果可以直接输出,构造检索提问式示例: 课题:数字化图书馆的文献检索服务 检索概念分析: document retrieval(文献检索) 并列概念 document delivery (文献传递) document delivery system(文献传递系统) digital library(数字图书馆) 同义词 virtual library(虚拟图书馆) electro

11、nic library(电子图书馆) 检索提问式: (document W retrieval or document W delivery ) and (digital W librar* or electronic W librar* or virtual W librar*),写出计算机检索策略表达式:,1. 基于计算机视觉(机器视觉)的缺陷检测 2. Pretent、pretenting、pretented 3. Fibers、fibres 4. Woman、women 5. Virus(非人类的 human) 6. environment protection 7. 晶体生长:Crystal growth,growth crystal, growth of crystal,,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号