文献检索(信息检索技术-11.8.29)

上传人:自*** 文档编号:25959421 上传时间:2017-12-20 格式:PPT 页数:29 大小:879.04KB
返回 下载 相关 举报
文献检索(信息检索技术-11.8.29)_第1页
第1页 / 共29页
文献检索(信息检索技术-11.8.29)_第2页
第2页 / 共29页
文献检索(信息检索技术-11.8.29)_第3页
第3页 / 共29页
文献检索(信息检索技术-11.8.29)_第4页
第4页 / 共29页
文献检索(信息检索技术-11.8.29)_第5页
第5页 / 共29页
点击查看更多>>
资源描述

《文献检索(信息检索技术-11.8.29)》由会员分享,可在线阅读,更多相关《文献检索(信息检索技术-11.8.29)(29页珍藏版)》请在金锄头文库上搜索。

1、,文献检索,文献检索,电子科学与工程学院高福斌,检索技术部分,/29,2,文献检索,第二部分 计算机信息检索技术,2.1 布尔逻辑检索(Boolean Logic)2.2 位置检索(Position Search)2.3 截词检索(Truncation)2.4 字段限定检索(Field Limiting)2.5 短语检索(Phrase Search)2.6 自然语言检索(Natural Language Search),/29,3,2.1 布尔逻辑检索(Boolean Logic),第二部分 计算机信息检索技术,文献检索,(1) 逻辑“与”算符:用 AND 或 * 表示;A概念和B概念的“与”

2、关系表示为: A AND B A and B A * B,/29,4,2.1 布尔逻辑检索(Boolean Logic),第二部分 计算机信息检索技术,文献检索,(2) 逻辑“或”算符:用 OR 或 + 表示;A概念和B概念的“或”关系表示为: A OR B A or B A + B,/29,5,2.1 布尔逻辑检索(Boolean Logic),第二部分 计算机信息检索技术,文献检索,(3) 逻辑“非”算符:用 NOT 或 - 表示;A概念和B概念的“非”关系表示为: A NOT B A not B A - B,/29,6,2.1 布尔逻辑检索(Boolean Logic),第二部分 计算机

3、信息检索技术,文献检索,(4)运算符的优先级运算 顺序如下:( )NOTANDOR。,例如:(激光器 OR 调制器) AND 制备方法,先进行括号内的检索,然后再将其检索结果与制备方法组配,目的是检索激光器或者调制器的制备方法。,/29,7,2.2 位置检索(Position Search),第二部分 计算机信息检索技术,文献检索,也叫邻近检索(Proximity Search),定义:位置算符检索是用一些特定的算符(位置算符)来表达检索词与检索词之间的邻近关系。目的:用于确定词语的相对次序或位置。,/29,8,2.2 位置检索(Position Search),第二部分 计算机信息检索技术,

4、文献检索,美国DIALOG检索系统的位置算符的用法:,(1) (W)With(W) 表示该算符两侧的检索词相邻,且两者之间只允许有一个空格或标点符号,不允许有任何字母或词,顺序不能颠倒。(W) 也可以简写为 ( )。,检 索 式:information()retrieval检索结果:information retrieval检 索 式: computer()aided()design检索结果: computer aided design,/29,9,2.2 位置检索(Position Search),第二部分 计算机信息检索技术,文献检索,美国DIALOG检索系统的位置算符的用法:,(2) (

5、nW)nWords(nW) 表示在此算符两侧的检索词之间最多允许间隔n个词(实词或虚词),且两者的相对位置不能颠倒。,检 索 式:laser (1W) printer检索结果: laser printer laser color printer,/29,10,2.2 位置检索(Position Search),第二部分 计算机信息检索技术,文献检索,美国DIALOG检索系统的位置算符的用法:,(3) (N)Near(N)表示该算符两侧的检索词相邻,但两者的相对位置可以颠倒。,检 索 式: computer (N) network 检索结果: computer network network c

6、omputer,/29,11,2.2 位置检索(Position Search),第二部分 计算机信息检索技术,文献检索,美国DIALOG检索系统的位置算符的用法:,(4) (nN)nNear(nN)表示此算符两侧的检索词之间允许间隔最多n个词,且两者的顺序可以颠倒。,检 索 式:computer (2N) system 检索结果: computer system computer code system computer aided design system system using modern computer,/29,12,2.2 位置检索(Position Search),第二部分

7、 计算机信息检索技术,文献检索,美国DIALOG检索系统的位置算符的用法:,(5) (S)Subfield(S)表示其两侧的检索词必须是在文献记录的同一子字段中,而不限定它们在该子字段中的相对次序和相对位置的距离。在文摘字段中,一个句子就是一个子字段。,检 索 式:computer ( ) control (S) system检索结果:“This paper is concerned with an application of the computer control technique in a intelligent system for testing inner walls of p

8、ipes.”,/29,13,2.2 位置检索(Position Search),第二部分 计算机信息检索技术,文献检索,美国DIALOG检索系统的位置算符的用法:,(6) (F)Field(F)表示其两侧的检索词必须是在文献记录的同一字段中,而它们在该字段中的相对次序和相对位置的距离不限。,例如:water ( ) pollution (F) control 表示在同一个字段中(如篇名、文摘、叙词等)同时含有 water pollution 和 control的文献记录均可检索出来。,/29,14,2.2 位置检索(Position Search),第二部分 计算机信息检索技术,文献检索,Ei

9、 Village检索系统中的位置算符(只有一种):,(N)Near (N)表示两个检索词彼此接近且两词之间最多不超过5个词,前后顺序不限。,例如:water ( ) pollution (F) control表示在同一个字段中(如篇名、文摘、叙词等)同时含有 water pollution 和 control的文献记录均可检索出来。,/29,15,2.2 位置检索(Position Search),第二部分 计算机信息检索技术,文献检索,CSA Illumina检索系统中的位置算符:,词间无算符,即表示将检索词作为一个词组来检索;WITHIN “x”,表示在指定的半径内(x个词)查找输入词,词

10、序不限;NEAR, 设定在相距不大于10个词的范围内查找输入词,相当于within 10;BEFORE, 按照输入检索词相应的顺序查找;AFTER, 按照第1个词在第2个词之后的相应顺序查找。,/29,16,2.2 位置检索(Position Search),第二部分 计算机信息检索技术,文献检索,IEL检索系统中的位置算符:,,表示算符两边的检索词必须出现在同一短语内,两个检索词的顺序可以前后颠倒;,表示两个检索词相邻,中间相隔最多n个词,两个检索词的顺序可以前后颠倒。,/29,17,2.3 截词检索(Truncation),第二部分 计算机信息检索技术,文献检索,截词检索是计算机检索系统中

11、应用非常普遍的一种技术。由于西文的构词特性,在检索中经常会遇到名词的单复数形式不一致;同一个意思的词,英美拼法不一致;词干加上不同性质的前缀和后缀就可以派生出许多意义相近的词等。为了保证查全,就得在检索式中加上这些具有各种变化形式的相关意义的检索词,这样就会出现检索式过于冗长,输入检索词的时间太久,同时也占太多机时。,/29,18,2.3 截词检索(Truncation),第二部分 计算机信息检索技术,文献检索,截词检索就是为了解决这个问题而设计的,它既可保证不漏检,又可节约输入检索式的时间。所谓截词,就是指在检索词的适当位置截断,保留相同的部分,用相应的截词符代替可变化部分,计算机会将所有含

12、有相同字符部分词的记录全部检索出来。,/29,19,2.3 截词检索(Truncation),第二部分 计算机信息检索技术,文献检索,美国Dialog系统用“?”表示截词符,有以下几种截词方式。(1)后方截词 后方截词,也称前方一致。它是将截词符放在一串字符的后面,用以表示以相同字符串开头,而结尾不同的所有词。 后方截词又分为词尾的有限截断和词尾的无限截断两种情况。,/29,20,2.3 截词检索(Truncation),第二部分 计算机信息检索技术,文献检索,美国Dialog系统用“?”表示截词符,有以下几种截词方式。,(1)后方截词 词尾的有限截断相同字符串后可能变化一个字符时,则在其后使

13、用一个“?”、空格、再加一个“?”,常用来表示检索词的单复数变化。例如用system? ?可以查出system和systems的文献。 相同字符串后可能变化两个以上字符时,则在其后连续使用若干个“?”代替可能变化的字符。例如,?表示两个字符,?表示三个字符,以此类推。,/29,21,2.3 截词检索(Truncation),第二部分 计算机信息检索技术,文献检索, 词尾的无限截断相同字符串后可能变化任何字符串时,则在其后使用一个“?”。这种方法可以查找出含有相同字符串的所有检索词。例如,comput? 可查出 compute, computer, computing,computation,c

14、omputerisation等。,/29,22,2.3 截词检索(Truncation),第二部分 计算机信息检索技术,文献检索,(2)中间截词 中间截词又称中间屏蔽,是一种用截词符屏蔽词中不同字符的方法。例如“woman”和“women”,可用“wom? n”代替;“defence”和“defense”可用“defen ? e代替。 截词符具有“OR”运算符的功能,能够扩大检索范围,而且减少了输入检索词的时间,节约了机时。 常用的截词符有?”、“*”,、“”、“”等多种表示形式,不同的检索系统其截词符的表示形式和截词检索的方式是不同的,,/29,23,2.3 截词检索(Truncation)

15、,第二部分 计算机信息检索技术,文献检索,例如:输入optic *,可检索出optic, optics, optical等;“?”用于词中表示可以代替一个字符,例如,输入wom?n可检索出woman, women.,Ei Village中的截词符为:“*”用于词中或词后表示可以代替多个字符,检索出相同词干的任意多个变化的词:,/29,24,2.4 字段限定检索(Field Limiting),第二部分 计算机信息检索技术,文献检索,字段限定检索是指限定检索词在数据库记录中的一个或几个字段范围内查找的一种检索方法。在检索系统中,数据库设置的可供检索的字段通常有两种:表达文献主题内容特征的基本索引字段和表达文献外部特征的辅助索引字段。基本索引字段包括篇名、文摘、叙词、自由标引词四个字段;辅助索引字段包括除基本索引字段以外的所有字段,像著者字段、著者机构字段、文献类型字段、语种字段等。每个字段都有用2个字母表示的字段标识符(或称字段代码)。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号