◎21科技文献检索的原理

上传人:tia****nde 文档编号:71246356 上传时间:2019-01-19 格式:PPT 页数:100 大小:1.55MB
返回 下载 相关 举报
◎21科技文献检索的原理_第1页
第1页 / 共100页
◎21科技文献检索的原理_第2页
第2页 / 共100页
◎21科技文献检索的原理_第3页
第3页 / 共100页
◎21科技文献检索的原理_第4页
第4页 / 共100页
◎21科技文献检索的原理_第5页
第5页 / 共100页
点击查看更多>>
资源描述

《◎21科技文献检索的原理》由会员分享,可在线阅读,更多相关《◎21科技文献检索的原理(100页珍藏版)》请在金锄头文库上搜索。

1、2.1科技文献检索的原理,什么是信息检索 广义:信息检索(information retrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。所以,它的全称又叫信息存储与检索(information storage and retrieval) 狭义:仅指该过程的后半部分,即从信息集合中找出所需信息的过程,相当于人们所说的信息查询(information search),一:根据检索手段的不同,信息检索可分为:,手工检索 光盘检索 联机检索 网络检索(网络检索是信息检索的发展方向),二:根据检索对象形式的不同,信息检索又可分为,文献型信息检索(docume

2、nt retrieval):是以文献(包括题录、文摘和全文)为检索对象的检索。凡是查找某一主题、时代、地区、著者、文种的有关文献,以及回答这些文献的出处和收藏处所等,都属于文献型信息检索的范畴。完成文献型信息检索主要借助于各种书目型数据库和全文数据库等。 数值型信息检索(data retrieval):是以数值或数据为对象的一种检索,包括某一数据、公式、图表,以及某一物质的化学分子式等。完成数据型信息检索主要借助于各种数值数据库和统计数据库。 事实型信息检索(fact retrieval):是以某一客观事实为检索对象,查找某一事物发生的时间、地点及过程的检索,其检索结果主要是客观事实或为说明事

3、实而提供的相关资料。如:2001年月通过的奥运会主办城市的结果与过程。完成事实型检索主要借助于各种指南数据库和全文数据库。,三:检索语言,标引员与检索员之间的约定语言 提供检索所需的文献特征 检索语言可分为两大类: 分类法 主题法,1.分类法,按学科门类区分图书,用分类号来表达文献主题内容,以分类表作为文献分类标引的工具。 典型的如: 中国图书馆分类法(中图法) 中国科学院图书馆图书分类法(科图法) 国际十进分类法,将图书分为马列毛泽东思想、社会科学、自然科学、综合三大类。 检索标识即分类号,由字母和数字组成 采用等级列举表达从属关系 上位类目与下位类目的关系: 上位类目一定包含各个下位类目,

4、 下位类目一定带有上位类目的属性。 分类号越长,表示的学科范围越窄。 为了清楚醒目, 通常分类号的第三位数字后,隔以.,如F279.712,TQ032.4,检索语言分类法中图法,R,S,T,医药、卫生,农业科学,工业技术,社会科学,自然科学,机械、仪表,建筑科学,综合,一般工业技术,矿业工程,石油,冶金工业,无线电、电子学、电讯技术,自动化计算,化学工业,轻工业、手工业,金属学,武器工业,动力工程,原子能技术,电工技术,水利工程,图3 1 中 图 法 展 开 图,检索语言分类法中图法,O 数理化 一级类目 O1 数学 二级类目 O3 力学 二级类目 O31 理论力学 三级类目 O311 运动学

5、 四级类目 .1 质点运动 五级类目 O4 物理学 二级类目,检索语言分类法,主要特点就是按学科专业性质集中图书 区分不同性质的图书 集中性质相同的图书 性质相近的放在相近的位置 按照远近亲疏的关系把图书组成为一个有条理的体系 提供从学科分类查找图书的途径。,中图法索书号(call number),索书号又称为排架号 反映了某种图书在整个图书组织中的排列次序和在书库中的具体位置(架位) 组成:分类号书次号 分类号:按学科分类图书 书次号:同类书的排列,书次号的两种取法:,种次号:按图书到馆的先后顺序给予号码。 缺点:会使同一著者的同一类著作排放在不同位置 著者号:按著者名称(代码)来区分同一分

6、类号下的不同文献,中图法图书的排架顺序,按索书号排架 先顺序分类号: 如果分类号相同再顺序书次号,2.主题语言,以自然语言为基础 用表达概念的词来提示文献的内容 标识符是文字。 如直接使用“金属陶瓷”、“感光材料”、“载重汽车”进行标引。 按主题词的字顺编排 查找方便、直观 不受学科从属关系的约束 能较好地满足特性检索的要求,主题法与分类法比较检索标识不同,分类法 检索标识人为定义的 标引文献时,把语言文字所构成的概念转换成号码 检索时,检索者要在号码中找出相当于文字形式的概念。 主题法 检索标识借用自然语言中表达概念的词,直观易记,便于掌握。,例聚丙烯纤维的生产工艺,例:查找聚丙烯纤维的生产

7、工艺的文献 分类法: 首先找到所属的分类号TQ346.2 才能查到相关文献。 主题法: 一篇聚丙烯纤维生产工艺的文献 标引时,直接用主题词“聚丙烯纤维”及“工艺”标引。 检索时,只需直接用“聚丙烯纤维”与“工艺”二个主题词组配检索,就能查到相关文献。,检索标识符的排列方法不同,主题法 检索标识符按主题词的字顺排列 不受体系约束 增补新词方便 能及时反映学科的发展 分类法 检索标识符按类号的逻辑次序排列,即按学科体系排列, 其体系固定, 难以增补新概念 迟后于学科发展。,揭示事物的角度不同,主题法 着眼于特定事物 以某一特定事物为中心,揭示与它相关的部分或全部问题 有利于特性检索。 分类法 学科

8、体系为主 研究事物属于什么学科、以及它与其他事物间的相互关系 利于族性检索。,对文献的集中与分散的角度不同,主题法 同一主题的文献集中在一个标题下 同一学科的文献分散在不同的标题中 分类法 同一学科的文献集中在一个类目下 同一主题的文献分散在不同的类目中 特别因学科发展而引起的相互渗透,使有些文献很难放在一个学科内。,例化学分析,主题法 在“化学分析”这一主题下,集中了所有“化学分析”的文献, 分类法 “化学分析”这一主题的文献被分散在各学科中,如在“金属学”“分析化学”“农业化学” “原子能技术”等学科领域中都可能有“化学分析”文献。,对于专指的主题的揭示不同,主题法 采用概念的组配或概念的

9、提级来表达主题。 分类法 不能组配标引 对专指的主题概念只能提级标引表达,例标引有关“聚丙烯纤维”方面的文献,主题概念聚丙烯纤维 分类法 只能标到分类号“TQ 346.2” 而关于聚丙烯纤维的各个研究方面无法细分 需表达其各个研究方面时,只能提级仍以TQ 346.2标引。 主题法 可采用“聚丙烯纤维”与“工艺”,“加工成型” “性质测试”“聚合”等词组配以获得更专指的概念。,主题词字顺排列,所以前后主题词之间往往是孤立的,不能表示学科体系的从属关系、不能显示前后词之间的内容上的联系。例“双联开关”这个主题词在主题词表中存在,但该词的前一词是“双联炼钢”,后一个词是“双列杂交”。这三个彼此相邻的

10、词在内容上是毫无联系的。这种排列法相对于分类法讲,其族性检索就差一些了。,主题词法与分类法的比较,主题词种类,关键词 单元词 标题词 叙词,主题词种类关键词(keyword),直接来源于从文献篇名、正文和文摘 为具有实际意义的词语 禁用词(stop-term)如冠词,介词,副词等除外 关键词法属自然语言,主题词种类关键词问题,同义词标引-引起漏检 主题检索体系是按主题词字顺排列的,而用于标引的关键词呈现出多种字面形式同义词时,将使同一主题的文献分散到不同的字顺位置,使查全率受到影响。 例:飞机 Airplane Aircraft Planes,主题词种类关键词,多义词标引引起误检 多义词 ce

11、ll 电池 细胞 检索词 cell 查找细胞方面的文献 结果: 电池、细胞两方面的文献 同时被检出,两个完全不同的概念,规范化主题词单元词,词义已是单元概念不可再分 规范词 例:单元词汽车,温度表,电动机 非单元词载重汽车 载重工具 汽车,规范化主题词标题词,主标题词除用单个名词或动名词外, 还有下列三种形式:,正叙式 倒叙式 并列式,主标题词正叙式,正叙式:直接采用事物的名称、现象、方法或 过程等词 COMPUTER PROGRAMMING LANGUAGES (计算机程序语言) ELECTRIC POWER SYSTEMS(电力系统) ELECTRON GUNS(电子枪) IMAGE PR

12、OCESSING(图像处理) MATERIALS SCIENCE(材料科学),主标题词倒叙式,倒叙式:将事物的名称放在前,后加修饰性的 词说明其范围。 COMPUTER,ANALOG(模拟计算机) COMPUTER, DIGITAL(数字计算机) OSCILLATORS,MICROWAVE(微波振荡器),并列式:将各自独立但又有某些联系的事物 或概念并列起来 如:PATENTS AND INVENTION (专利与发明) ROCKET AND MISSILES (火箭与导弹) SILICON AND ALLOYS (硅和硅合金),主标题词并列式,标题词与关键词、单元词的不同,表达主题概念: 关

13、键词和单元词用单个词 标题词用一对词,而且这一对词的组配关系是 固定的,规范化主题词叙词,是指表示单元概念的规范化词语 来源: 单元词先组词 先组词是以“ 适当先组”的原理,把在一定学科领域中,经常出现的组合词选作先组词,以减少查找时不必要的组配 如: 活性的(active) 碳(carbon) 活性碳(active carbon) 碎裂(fragmentation)弹药(ammunition) 杀伤弹药(fragmentation ammunition ),主题标引,赋予二次文献检索标识主题词 主题标引的步骤: 分析文献内容 形成主题概念 标引主题词 将标引主题词按字顺排列 使论述同一主题内

14、容的文献集中在一起,主题标引,通常,一篇文献所要表达的主题概念或要涉及的问题不止一个,所以与分类号不同,标引一篇文献的主题词通常不止一个。 例:图书工程材料的断裂与疲劳 涉及主题概念: 工程材料、断裂、疲劳,主题标引,标引主题词:工程材料、断裂、疲劳 这样从这三个主题词中的任何一个入手,都可以查到这本书,主题词表,分类表 图书分类的依据 主题词表 对文献进行主题标引的依据 单元词表、标题表、叙词表 下面对叙词表进行简单介绍 在叙词法中,文献的主题概念可以用多个叙词表示,因此可以形成任意合乎逻辑的组配和众多的检索途径。很适用于计算机情报检索。,2.2科技文献检索的工具,一:检索工具的定义 检索工

15、具是人们用来存储、报道和查找文献的工具。 二:检索工具的作用 1:保证查全率和查准率 2:缩短检索过程,节省时间 3:可以多角度查询 4:消除文字障碍 三:检索工具的形式 书本式,卡片式,微缩式,机读式,四:检索工具的类型,目录型检索工具 文摘型检索工具 题录型检索工具 文献指南和书目之书目 机读型检索工具,五:计算机检索的发展历程 脱机检索 联机检索 国际联机检索 单机光盘检索 光盘网络检索 Web信息资源检索,1.脱机检索(50年代末60年代中期 ),这时是计算机检索的原始时期,计算机由电子管组成,主要存储介质是磁带、磁鼓,只能进行简单的检索。(第一台计算机诞生于1946年,美国的宾夕法尼

16、亚州) 专业检索人员定期批量处理用户的情报要求 用户不能立刻获得检索结果 检索结果为题名,作者,文摘等。 在脱机检索阶段,计算机主要进行文献目录、索引、文摘等前处理工作。,2.联机检索(60年代末70年代初),1963年-1964年间,美国洛克希德导弹与宇航公司的情报实验室建立了”人机“对话的联机情报检索系统(DIALOG的前身),此后在60年代末到70年代初联机检索系统得以快速发展。国际著名的DIALOG系统、ORBIT系统、MEDLINE系统都是从这个时期发展起来的。 多个检索终端,通过通讯线路与联机检索系统中央计算机(主机)联接 利用分时技术,使多个用户可同时与主机以“对话”方式进行检索 用户可随时浏览检索结果 由于这个

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号