第二章检索语言教学纲要.doc

上传人:鲁** 文档编号:551760239 上传时间:2023-10-02 格式:DOC 页数:3 大小:45KB
返回 下载 相关 举报
第二章检索语言教学纲要.doc_第1页
第1页 / 共3页
第二章检索语言教学纲要.doc_第2页
第2页 / 共3页
第二章检索语言教学纲要.doc_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《第二章检索语言教学纲要.doc》由会员分享,可在线阅读,更多相关《第二章检索语言教学纲要.doc(3页珍藏版)》请在金锄头文库上搜索。

1、第二章检索语言教学纲要一、检索语言的概念二、检索语言的作用三、检索语言的类型n 一、检索语言的概念n 检索语言就是为沟通文献标引与文献检索而编制的人工语言,也是连接信息存储和检索两个过程中标引人员与检索人员双方思路的渠道,是用于文献标引和检索提问的约定语言。n 简单的说就是:n 描述文献信息特征和表达检索提问的人工语言,是从自然语言中精选出来并加以规范化的一套词汇、符号。二、检索语言的作用n 检索语言是人与检索系统对话的基础。n 检索语言在标引和检索过程中的作用见下图:三、检索语言的类型n 检索语言的种类很多,划分方法不一,通常分为表达文献外表特征和表达文献内容特征两大类。n 表达文献外表特征

2、的有:n 题名语言(书名、刊名、篇名等)n 著者语言(著者、团体著者、译者、编者等)n 号码语言(专利号、标准号、报告号等)n 表达文献内容特征的有:n 分类语言n 主题语言(关键词语言、规范化词语言) 三、检索语言的类型n 在两类检索语言中:n (1)描述文献外表特征的信息检索语言:n 按字母或号码顺序排列,比较直观,容易理解,使用起来比较简单,误检或漏检的可能性少,容易掌握。n (2) 表达文献内容特征的信息检索语言:n 结构和使用比较复杂,有分类语言和主题语言两种。n 以下重点介绍分类语言和主题语言。三、检索语言的类型n (一)分类语言:n 分类语言是用分类号来表达信息主题概念,运用概念

3、划分与概括的方法,按学科性质分门别类地将信息系统地组织排列的一种人工语言。 n 每一类目分别以不同的符号(字母、数字或字母数字相结合)作标志,每个符号都表达了特定的知识概念。n 这种标志就是分类语言,大多数分类表都是按分类语言编制而成的。三、检索语言的类型n 目前国内外常用的分类法有:n 1 杜威十进制分类法(Dewey Decimal Classification and Relative Index 简称DDC) n 2 国际十进制法(Universal Decimal Classification,简称UDC)(被广泛应用于科学论文的分类)n 3 美国国会图书馆图书分类法(Library

4、 of Congress Classification,简称国会法或LC)(目前广泛应用于北美大中型图书馆,特别是大学等学术性图书馆 )n 4 中国图书馆分类法(目前应用于国内大中型图书馆中国图书馆分类法简介n 中国图书馆分类法是1971年由北京图书馆倡议,全国36个单位组成的编写组集体编制的,于1975年正式出版,1980年、1990年、1997年1999年先后修订四次,目前使用的是第四版。n 中国图书馆分类法是我国当代具有代表性的图书分类法,被推荐为我国标准图书分类法广泛使用于图书馆和情报部门。中国图书馆分类法简介n 中国图书馆分类法简称中图法,是按照一定的思想观点,以科学分类为基础,结合

5、图书资料的内容和特点,分门别类组成的分类表。n 它将知识分为哲学、社会科学、自然科学三大部类。这三大部类前后分别加上一个马列主义类和综合性图书类,组成中图法的五个基本部类。 其中,社会科学部类下又进一步展开为九大类,自然科学部类下展开为十大类。此外,在社会科学和自然科学各大类之前,均分别列出其总论类。这是根据图书资料的特点,按照从总到分、从一般到具体的编制原则编列的,以组成社会科学和自然科学的完整体系。 n 中图法是用来把书及其他文献资料分门别类组织起来的依据,我馆图书资料就是按照中图法分类、组织、排架的。中国图书分类法体系结构n 全部22大类如下: (1)马克思主义、列宁主义、毛泽东思想 A

6、 马克思主义、列宁主义、毛泽东思想(2) 哲学 B 哲学(3)社会科学 C 社会科学总论 D 政治、法律n E 军事n F 经济 G 文化、科学、教育、体育 n H 语言、文字n I 文学n J 艺术 n K 历史、地理(4)自然科学 N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医药、卫生 S 农业科学 T 工业技术 U 交通运输 V 航空、航天 X 环境科学、劳动保护科学(5)综合性图书 Z 综合性图书中国图书分类法运用实例n H314类图书索取号如图:n 在图书馆的书目检索系统内查找图书,我们通过索取号到书库查找图书。中国图书分类法运用实例n 图书馆索取号

7、的构成方法:n 索取号是图书馆赋予每一种馆藏图书的号码。n 这种号码具有一定结构并带有特定的意义。n 在馆藏系统中,每种索取号是唯一的,以此准确地确定图书在书架上的排列位置,是读者查找图书时非常重要的号码信息。n 索取号=分类号+著者号码/种次号(该书刊入馆时间的先后)n 例如 :H316 G252.7n 3784 78中国图书分类法运用实例n 确定不同索取号排列先后顺序的步骤是:n 先比较分类号,采用对位比较法,n 如分类号相同,再比较著者号码或种次号,采用自然顺序排列的方法。n 即先按着22大类由A到Z的顺序排列,n 然后下面在按着自然顺序排列。例如: F23-61 H316 TP317

8、TP39 TP393 TP393 4521 3784 44 1024 85 105 以上索书号应从左到右依次排序。中国图书分类法体系结构n 中图法的分类方法将各学科文献分为22个大类,用A到Z间的字母表示,但除去L、M、W、Y四个字母。 n 为什么编制中图法的专家没有使用这四个字母呢?n 这是因为随着学科的发展,将来可能会出现一些新的学科,这些新的学科无法划人到已存在的类目中去,就可以用这些预留的字母来表示,以满足分类号扩充的需要。 三、检索语言的类型n (二)主题语言n 主题语言是一种描述语言,是用自然语言中的词、词语来描述文献内容特征。这种词或词语就是主题词。n 也就是说,不论学科分类如何

9、,主题语言直接借助于自然语言的形式,作为文献内容的标识和检索依据,是一种以主题词字序未基本结构的检索语言,比较直观。 n 主题语言可分为n (1)关键词语言 (自由词语言)n (2)规范化词语言(叙词、标题词语言) n (1)关键词语言:n 关键词:是文献标题、文摘或原文中抽选出来的对表达文献主题内容起关键作用的、具有实质意义的词汇。n 它的主要特点是:关键词属于自然语言,未经规范处理,不受词表控制,它来自文章标题或文摘、正文中,专指度高,用作检索词,查准率高,但查全率低。n 如: 有一篇“教育与国民经济”的文献n 用主题词法检索,我们可以用“教育”和“国民经济”两个词来检索此篇文献。n (2

10、)规范化词语言:n 规范化词:是指从自然语言中优选出来并经过规范化处理的名词术语。n 把规范化词按照一种便于检索的方式编排起来,就构成了主题词表。n 这些主题词表是由各个学科领域权威的专家,经过认真严格的考虑和筛选制定下来的。n 我国也便有专门的汉语主题词表和各专业主题词表如纺织汉语主题词表n n 汉语主题词表是我国第一部大型综合性主题词表。1979年出版,自然科学部分1991年修订收录正式主题词91158条,非正式主题词17410条。n 全表共分3卷10分册,由主表、词族索引、范畴索引、英汉对照索引等组成。n 是我国应用最广的一部主题标引和检索的工具。n 收录词表的主题词一般包括:n 事物名

11、称类:如汽车,变压器等;n 科学门类:如数学,物理等;n 事物状态或现象类:如强度,失真等;n 研究方法、技术类:如分析,力学性能实验;n 工艺方法、加工名词类:如织造,激光切割等;n 化学元素、化合物、金属材料类:如钠,硫酸等n 国家名称、地名、人名类:如赤峰,鲁迅等。n 以上这些都可以作为主题词来检索。n 主题词语言的特点:n 主题词语言来源于自然语言,适合人们的辨认习惯,标识比较直观,表达概念唯一,而且多个主题词的合理组配,可以形成专指性较强的概念。对专指性强或主题比较复杂的课题检索比较方便。n n 主题词语言的选用技巧:n 主题语言的基本成分是检索词,检索词的确定是检索成败的关键。检索

12、词的选取要全面,应尽可能地包含各主题概念。n (1)主题词的选取应适当,具有专指性,范围不宜过宽或过窄。若选取范围过宽,缺乏查准率;若选取范围过窄,又缺乏查全率。n (2)尽可能的考虑其相关的同义词,近义词作为检索词,以保证查全率。例如土豆可以 说成马铃薯等所以在选取主题词时应尽可能地考虑其相关的同义词,近义词,同时还要考虑单复数,动名词,过去分词等。n (3)某些词的含义很广,不适合作检索词。如研究、实施、建立等泛指的词不宜作检索词;但在检出文献较多时,可以用趋势、现状等加以限制;范围太大的不适合作检索词,例如计算机,可以更加细化,比如计算机应用,计算机安全等来进行检索,使其检索范围减小,检索结果更准确。n (4)当检索文献量偏少时,可以扩大检索词范围,以增加查全率。如查找日语类文献,比较少,则可以点查找外国语言为检索词,增加查全率。n

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号