MAX《文献查阅》3 电子信息检索基础

上传人:az****29 文档编号:56908531 上传时间:2018-10-17 格式:PPT 页数:69 大小:479.50KB
返回 下载 相关 举报
MAX《文献查阅》3 电子信息检索基础_第1页
第1页 / 共69页
MAX《文献查阅》3 电子信息检索基础_第2页
第2页 / 共69页
MAX《文献查阅》3 电子信息检索基础_第3页
第3页 / 共69页
MAX《文献查阅》3 电子信息检索基础_第4页
第4页 / 共69页
MAX《文献查阅》3 电子信息检索基础_第5页
第5页 / 共69页
点击查看更多>>
资源描述

《MAX《文献查阅》3 电子信息检索基础》由会员分享,可在线阅读,更多相关《MAX《文献查阅》3 电子信息检索基础(69页珍藏版)》请在金锄头文库上搜索。

1、电子信息检索基础,第一节 电子信息资源与数据库,一、电子信息资源类型电子资源是信息资源的一种,是电子化了的信息资源,它可以按照不同的划分标准进行分类1. 按信息的载体及通信方式分类 联机信息资源 光盘信息资源 Internet网络信息资源2. 按照信息的表现形式分类 文本信息资源 超文本信息资源 多媒体信息资源 超媒体信息资源,第一节 电子信息资源与数据库,二、数据库类型目前在情报界流行的是按照数据库所提供的信息内容作为基本的分类标准,即数据库分为:,第一节 电子信息资源与数据库,1. 文献参考数据库存储描述性的信息内容,包括各种机读版的目录、文摘、索引等,它的作用是指引用户到其它信息源去获得

2、完整的原始信息指南数据库主要存储关于机构、计划、活动、人物等对象的数据库 它不直接向用户提供所需信息的详细内容,但可以起到指示和介绍的作用,指引用户从其它相关信息源去获取更详细的信息,第一节 电子信息资源与数据库,书目数据库主要存储某一领域原始文献的书目,包括图书、目录、题录、索引等,是一种二次文献数据库。记录的实体有期刊论文、图书、博士论文等,它的作用是为用户提供获取原始信息的线索,1. 文献参考数据库,第一节 电子信息资源与数据库,2. 源数据库其特点是本身包含有一次文献,主要存储用户作为检索目的而要获取的数值、事实或文本,人们称之为“纯情报”或“浓缩情报”。全文数据库存储文献内容的全文或

3、者其中主要部分的源数据库 可直接检索出用户所需的原始文献的全文,第一节 电子信息资源与数据库,数值数据库以数值形式来存储信息的一种源数据库可直接为用户提供所需的数据信息用户还可在计算机程序的帮助下进行运算和分析,并能进行分类、排序和重新组合,2. 源数据库,第一节 电子信息资源与数据库,三、数据库的构成1. 书目数据库的结构该数据库的主要部分是一系列的“记录”所组成的“文档”,每一条“记录”又是由不同的数据项目即“字段”所构成的,第一节 电子信息资源与数据库,字段在书目数据库中,著录在计算机中的基本信息单位称为字段如:标题字段、著者字段、文摘字段、分类号字段等在每个字段的左侧以2个英文字母的缩

4、写来表示该字段的含义这些字段通常分为基本字段和辅助字段两种,1. 书目数据库的结构,第一节 电子信息资源与数据库,常见字段名称与代码对照表,第一节 电子信息资源与数据库,记录记录是作为一个单位来处理有关数据的集合,由若干字段组成一个记录通常由标题字段、文摘字段、主题词字段、作者字段等组成,1. 书目数据库的结构,书目记录:ACCESSION: 31739598AUTHOR: Dichter, Carl.TITLE: Software engineering with Perl PLACE: Englewood Cliffs, N.J. PUBLISHER: Prentice Hall PTR,

5、YEAR: 1995 PUB TYPE: BookFORMAT: 282 p. : ill. ; 24 cm. + 1 computer disk (3 1/2 in.)NOTES: Includes bibliographical references (p. 267-268) and index System requirements for accompanying computer disk: High Density MSDOS; Macintosh with PC Exchange.ISBN: 013016965XSUBJECT: Software engineering.Perl

6、 (Computer program language)Software EngineeringOTHER: Pease, Mark.,第一节 电子信息资源与数据库,文档将一批相关记录按一定的结构方式组织起来的有序的可供检索的集合,叫文档文献记录在文档中的组织排列,叫文档结构文档结构分为顺排文档和倒排文档两种,第一节 电子信息资源与数据库,在文档中,文献记录按存取号顺序存放,记录之间的逻辑顺序与物理顺序是一致的,称为顺排文档,它相当于手工检索工具的正文部分倒排文档是按照数据库中的记录中的主题性字段(如主题词字段、叙词字段)或非主题性字段(如机构字段、作者字段等)作为检索标识重新组织而成的文档,

7、文档,第一节 电子信息资源与数据库,具有主题性质的倒排文档叫基本索引文档具有非主题性质的倒排文档叫辅助索引文档顺排文档是以完整的记录作为处理信息和检索信息的单元,是主文档倒排文档是以记录中的某一字段作为处理信息、检索信息的单元,是索引文档,相当于印刷型检索工具中的辅助索引,文档,第一节 电子信息资源与数据库,2. 数值数据库的结构数值数据库一般包含来自原始文献或调查统计的、并已经经过处理的各种数值或数据表格数值数据库通常也有多种文档的形式,如顺排文档、倒排文档和索引文档等不论何种形式的文档,数值数据库中所有数据都能够进行运算是数值数据库的特点,第一节 电子信息资源与数据库,3. 全文数据库的结

8、构一般与书目数据库的结构相似,不同之处在于全文数据库中的每一个记录就是一个全文文本,是用户可以直接拿来使用的信息文档形式主要有顺排和倒排两种,第一节 电子信息资源与数据库,4. 指南数据库的结构同时具有全文数据库、书目数据库和数值数据库的特点有顺排文档、倒排文档、索引文档和数据字典几种形式,速度快 由于计算机检索系统采用灵活的逻辑运算,使各有关检索词之间能灵活地进行组配,因而可以不受文献内容交叉的限制,迅速而准确地检索出所需文献 利用计算机检索系统中的文献数据库,可以很方便地产生多种形式的资料,如卡片式目录,专题索引、专题文摘等 批处理方式 远程检索,计算机信息检索特点,计算机信息检索基本原理

9、,简称“机检”,第一节 电子信息资源与数据库,电子信息及网络信息检索系统主要由计算机、数据库、通信网络及检索终端组成目前使用的主要是: 联机检索系统 光盘检索系统 网络信息检索系统,第二节 计算机信息检索的方法,根据检索课题:选择适用的数据库;确定检索词;编制检索式;显示及判断检索结果;输出相关内容 选择数据库:注意学科范围、文献范围、国别或语种范围 确定检索词:注意满足课题检索要求和数据库输入词要求 编制检索式(见下页) 选择检索词原则:选择规范词;尽量使用代码; 注意常用技术术语;同义词尽量选全; 避免使用高频词和低频词,检索提问式的编制,布尔逻辑检索 位置逻辑检索 截词检索 字段限制检索

10、 加权检索,1. 布尔逻辑检索,规定检索词之间逻辑关系的算符,有:逻辑与(and ,*)逻辑或(or ,+)逻辑非(not ,-), 逻辑“与” :AND或,用于组配不同检索概念,检索出的记录中须同时含有所有检索词。 基本作用是缩小检索范围,提高检索结果的查准率。 如SOLAR AND ENERGY,只有既含检索词SOLAR又含检索词ENERGY的文献才能检出。,用于组配具有同义或同族概念的词,如同义词、相关词等。基本作用是扩大检索范围,防止漏检,提高检索结果的查全率。如:SOLAR OR SUN 凡含有检索词SOLAR和SUN任何一个或二个同时存在的文献均可检出,扩大了检索范围。, 逻辑“或

11、”:OR或,用于排除含有某些词的记录,即检索结果中只能含NOT算符前的检索词,不能同时含有其后的词。基本作用是缩小检索范围。联机可降低检索费用。如:patent not German ,表示检索除德国以外的专利文献。, 逻辑“非”:NOT 或,布尔逻辑运算次序为:逻辑非逻辑与逻辑或,若有括号则括号优先,这同算术中的四则运算相似。布尔逻辑的运算也可以进行合并同类项等,如:A*B+A*C=A*(B+C),但须注意以下几条交换规则:A*B=B*A A+B=B+A A-BB-A,1. 布尔逻辑检索,适用于两个检索词,以指定间隔距离或指定顺序出现的场合。 常用于:以词组形式表达的概念、彼此相邻的两个或两

12、上以上的词、被禁用词或特殊符号分隔的词、化学分子式等。 位置算符可改进AND算符的不足之处。按照两个检索词出现的顺序和距离,可有多种位置算符。不同检索系统对位置算符规定不同。,2. 位置逻辑检索, (W)-A(W)B 表示两侧的检索词必须前后邻接,顺序不得颠倒,两词之间不能插入任何词,允许空格或标点符号。如:computer (w) aided (w) design检索结果包含:computer aided design、computer-aided design和computer-aided-design,(1)词间位置检索, (nW)-A(nW)B 表示两侧的检索词之间允许插入n个词,但两

13、个检索词的词序不允许颠倒如:Wear (1w) materials检索结果包含:Wear materials和wear of materials,(1)词间位置检索, (N)及(nN)-A(N)B或A(nN)B如:information(1N)retrieval检索结果包含:information retrievalretrieval of information等,(1)词间位置检索,(2)子字段或自然句检索,(S) - A(S)B 要求两个词出现在同一子字段或自然句中,其先后顺序不受限制如:automation(s)control/TI 检索结果:要求automation和control必

14、须同时出现在题名字段中才是命中记录,(F)-A(F)B 表示两侧的两个检索词必须同时出现在文献记录的同一个字段内(如题名字段、文摘字段、规范词字段等)如:environment?(F)impact/DE,TI表示environment(或environments)与impact必须同时出现在DE(叙词)字段或TI(篇名)字段。,(3)同字段检索,3. 截词检索,此算符可看作是将某一部分相同的检索词用“或”算符连接后进行检索。 不同数据库有不同的截词符,如DIALOG用?,而ORBIT系统用+。 基本作用是:减少输入步骤,简化检索程序,扩大检索范围,提高查全率,节省机时,降低费用。 一般可分为后

15、截断、前截断、中间截断、混合截断四种。,(1)后截断,后截断可保持词首部分的一致性。 非限定性截词? smok? 其后可加字符数不限 限定性截词 smok? 其后最多加三个字符 可检出:smoke, smoky, smoker, smokers,smokes, smoking等 smok? ? 其后只允许加一个字符 可检出:smoke, smoky等,(2)前截断,前截断可保持词尾部分的一致性。 如: ?computer ,可实现:microcomputer , minicomputer 的检索,(3)中间截断,中间截断可实现对某词不同拼法的检索。 如:computeri?ed ,可实现:co

16、mputerised , computerized 的检索,(4)混合截断,混合截断可以实现对不同词根、词首及中间部分不一致的检索。 如:?computer? ,可实现:computer , computerized , computers , microcomputer , microcomputerized , minicomputer 的检索,4. 字段限制检索,在进行计算机检索时,一般将基本索引字段代码附于所选定的检索词之后,计算机系统即在指定的字段中进行检索,如果检索词前后未指定字段,则系统将自动检索所有基本索引字段。(不过不同的计算机检索系统所用的字段标识符和标识符放置位置不尽相同)。,4. 字段限制检索,辅助索引字段是描述文献外部特征的字段,如著者、机构名称、语种、刊名、来源、出版年等。 在检索DIALOG联机检索系统中的数据库时,一般将辅助索引字段代码置于检索词前,称为前缀。它一般不单独使用,常与基本索引字段配合使用,起着一种限定检索范围的作用。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 教育学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号