番茄花园优化纯净版-文献检索语言

上传人:tia****nde 文档编号:66990357 上传时间:2019-01-06 格式:PPT 页数:49 大小:1.30MB
返回 下载 相关 举报
番茄花园优化纯净版-文献检索语言_第1页
第1页 / 共49页
番茄花园优化纯净版-文献检索语言_第2页
第2页 / 共49页
番茄花园优化纯净版-文献检索语言_第3页
第3页 / 共49页
番茄花园优化纯净版-文献检索语言_第4页
第4页 / 共49页
番茄花园优化纯净版-文献检索语言_第5页
第5页 / 共49页
点击查看更多>>
资源描述

《番茄花园优化纯净版-文献检索语言》由会员分享,可在线阅读,更多相关《番茄花园优化纯净版-文献检索语言(49页珍藏版)》请在金锄头文库上搜索。

1、文献检索语言,1.文献检索语言的概念 2.文献检索基本原理 3.文献检索语言的类型,. 文献检索语言的概念,定义: 是根据文献存贮与检索的需要编制的,供标引文献和检索文献用的一种人工语言,是标引者和检索者共同约定使用的语言。,本质:是对文献所包含的外表特征和内容特征按照一定的语言(包括词、词组、短语、符号)来描述,如果把这些词、词组、短语、符号等作为标识,按一定规律排列起来,就等于把文献按某种特征进行组织。检索时,再从这些标识入手,就能检索出某种特征文献信息。这种经过组织形成的标识系统就是检索语言。而这些检索语言就成为文献检索途径,也称为检索字段或检索项。,功能: (1)能准确地标引文献内容及

2、特征,保证不同的标引者在标引文献时表达一致。 (2)能在标引者和检索者之间起到桥梁作用,使二者在文献主题概念的理解和表达上达到一致,提高检索的准确性。 (3)可使内容相同和相关的文献集中,使大量分散的文献存储系统化、组织化,便于进行有规律的检索,提高检索效率。,主题概念,文献特征标识,主题概念,检索表达式,文献,主题分析,检索工具(系统),用检索语言对文献进行描述,检索需求,主题分析,用检索语言对文 献进行描述,是否匹配,否,输出结果为零,得到检索结果,是,2.检索原理图,情报工作人员,检索者,检索提问标识,文献存储过程,检索过程,3.文献检索语言的类型,号码语言:专利号;标准号;ISBN号;

3、ISSN号;,描述文献外部特征的语言,描述文献内容特征的语言,题名语言:书名、篇名,著者语言:一般按姓前名后的字顺逐字排检,分类语言:根据学科内容等对文献进行 分类。 如图书分类号、国际专利 分类号、 标准分类号等,主题语言:自然语言 人工语言,3.1根据表述文献的特征分,机构语言,引文语言,自然表达某一概念的语言,没有强制性的规定。通俗地说,就是对于一个概念你想怎么表达就怎么表达。在文献检索中,关键词(key words)等用的就是自然语言.,人为规定的概念表达语言。通俗地说就是对于一个概念你必须使用规定的语言来表达。在文献检索中,主题词(subject)通常用的就是人工语言,自然语言:,人

4、工语言:,3.2按结构原理分 体系分类语言 主题法语言:标题词语言;关键词语言; 叙词语言,3.2.1 体系分类语言,1)定义:是建立在科学分类体系基础上用分类号表达文献主题概念的检索语言。 它使用分类号来标识类目,分类号可反映类目在分类体系中的位置和排列次序。 2)种类: 中国图书馆图书分类法 (简称中图法) 中国科学院图书分类法 (简称科图法) 杜威十进制图书分类法( DC ) 国际十进制图书分类法(UDC),中国图书馆分类法(中图法),A 马列毛邓,B 哲学宗教,T 工业技术,TB一般工业技术,TD矿业工程,TE石油天然气工业,TV 水利工程,TB1工程基础科学,TB2工程设计与绘测,T

5、B3工程材料学,TB9测量学,TB30工程材料一般性问题,TB31金属材料,TB37耐腐蚀材料,Z综合性图书,3)体系结构( 中图法 ),结构组成:基本部类,大类,简表,详表 基本部类有五大类: 马克思主义、列宁主义、毛泽东思想 哲学 社会科学 自然科学 综合性图书,22个大类,其标识符和类名如下表:,A 马克思主义、列宁主义、毛泽东思想 B 哲学 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理 N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医药、卫生 S 农业科学 T 工业技

6、术 U 交通运输 V 航空、航天 X 环境科学 Z 综合性图书,简表:22个大类下细分构成简表,S 农业科学 S1 农业基础科学 S2 农业工程 S3 农学(农艺学) S4 植物保护 S5 农作物 S6 园艺 S7 林业 S8 畜牧、 动物医学、蚕、狩猎、蜂 S9 水产、渔业,详表:简表细分又构成详表,4)特点: 优点:用体系分类语言标识文献能按学科或专业集中而系统地揭示文献,便于从学科和专业的角度出发进行族性检索,查全率高。 缺点: 间接性:检索时要经过多重间接转换(主题概念-学科概念-语言标识符号),转换过程难以掌握,不便于检索。 单维性:其结构体系属于直线式序列结构,难以反映学科交叉渗透

7、而产生的多维知识空间,在检索文献时易发生漏检,不能全面检索有关跨学科专业的某一事物的所有文献。 局限性:其结构具有相对稳定性,无法反映新学科和新技术的内容。,5)索书号,定义:由字母和数字组成的号码 ,是确定一本书排架的依据。 结构:中图法的分类号/著者号(种次号) 例子: 谁执掌了世界金库的钥匙(作者:张俊杰) 索书号:F715/Z284 地理学报 P9/1 地理研究 P9/2,3.2.2主题法语言,1.定义:是一种描述语言,是直接以自然语言中代表事物、问题和现象的名词术语作为揭示文献主题内容的检索标识,并以此标识编排组织和查找文献的排检方法。 主题词:是表达主题概念的词语,优选出的词语必须

8、词义明确,避免其多义性,并受特定的词表控制。,2)分类: 据主题词的选词原则、组配方式和规范方法: 标题词语言 关键词语言 叙词语言,a1定义:以标题词(规范的事物名称、名词术语)作为文献主题内容的标识和检索标识的一种主题法语言。 标题词是从大量科技名词中选出的具有实质意义、并能准确表达文献主题内容、具有固定组配关系的规范化名词或名词性词组。如wheat germ(麦芽)、 GREENBUG(麦二叉蚜)等 WHEAT aphid,a标题词语言,a2标题词表:,工程标题词表 (The Engineering Index,简称SHE) 由美国工程信息公司编辑出版,是和工程索引(the Engine

9、ering Index,简称EI)检索工具配套使用的规范词表,在1987年修改补充的基础上,1990年又作了新的修订,之后定名为Ei Vocabulary。,著录款目, INFORMATION SCIENCE 903 (Before 01/86,use code 901) Abstracting (Beginning01/81) Indexing (Apply code 723 if computerized) (723) Information Retrieval (For systems, see INFORMATION RETRIEVAL SYSTEMS) Information Use

10、 Language Translation and Linguistics (723) (Apply code 723 if computerized. See also TRANSLATING MACHINES) 说明:主标题词;注释项,说明词的使用范围、用法及含义;副标题词;见项,指向规范化的标题词;参见项,指向相关的标题词;分类号(用于计算机检索)。,OVID :CAB,见项参照:指向规范化的标题词,参见项参照:指向相关的标题词,a3特点: 优点: 使检索具有直接性与直观性; 适合于从事物出发按专题进行特性检索 缺点: 缺乏按学科进行族性检索的能力; 缺乏表述专指度较高的复杂概念的能力;

11、 缺乏多途径检索和自由扩检的能力。,b1定义:以关键词作为文献主题内容的标识和检索标识的一种主题法语言。,关键词:直接从文献题名、文摘或全文中抽取出来的有实际检索意义的信息单元(关键词)。关键词是非规范的,无需查阅标准词表,或者只编制一个“禁用词表”,它收录为数不多的禁用词,如助词、连词、介词、冠词以及一些通用概念的词。,b关键词语言,b2特点: 优点:关键词法不受词表控制,快捷简便,适于 用计算机组织和检索文献信息; 缺点:由于关键词法的词语不规范,影响了文献 信息的查全率和查准率。,c1定义:以叙词做主题词的一种主题法语言 c2叙词表:汉语主题词表,叙词:是一种以概念为基础的,从自然语言中

12、优选出来的并经规范化处理的名词术语,具有单义性,组配性能好的特性。,c叙词法,词目一: 正式叙词与非正式叙词款目结构 shou fa kai guan guan 收发开关管 56CD 范畴号 Transmit receive tubes D 放电器 收发管 F 放电管 宽频带开关管 窄频带开关管 S 充气管 Z 电子管*族首词符号 C 反收发开关管 词目二: shou fa guan 收发管 56CD Transmitreceive tubes Y 收发开关管,汉语主题词表,汉语主题词表的结构:,主表: 全部叙词+部分非叙词 注释 范畴号 参照系统 附表:从主表中分离出来的专用叙词表,包括世界

13、各国政区名称、自然地理区划名称、组织机构、人物名称,词目三: Gao Wen fa 高温阀(温度4500C)含义注释 词目四: Fen xi(hua xue) 分析(化学)*使用范围注释 Analysis(chemical) F 半微量分析,参照系统(叙词参照符号及语义关系),词目一: 正式叙词与非正式叙词款目结构 shou fa kai guan guan 收发开关管 56CD 范畴号 Transmit receive tubes D 放电器 收发管 F 放电管 宽频带开关管 窄频带开关管 S 充气管 Z 电子管*族首词符号 C 反收发开关管 词目二: shou fa guan 收发管 56

14、CD Transmitreceive tubes Y 收发开关管,汉语主题词表,指引相应的正式主题词,指引相应的非正式主题词,指引有语义关联的相关词,指引所含的下位主题词,指引所从属的上位主题词,辅助表: 词族索引:等级索引,利用概念成族原理 范畴索引:分类索引,采用三级分类制体系,数字与字母混 合的号码标记制度,把主表中全部叙词按学科分类排列。 英汉对照索引:按英文名称字母顺序排列,提供从英文名查 找叙词的检索途径。,词族索引款目结构:,chu deng shu xue 初等数学 * 初等代数 初等几何 立体几何 平面几何 三角 球面三角 算术,范畴索引款目结构:,45 生物科学 45R 人

15、类学 45RA 古人类学 阿特拉猿人 Y 毛里坦直立人 北京猿人 Y 北京直立人 北京直立人,英汉对照索引款目结构:,Air drag 空气阻力 Y 大气阻力 Air drilling 空气钻进 Air drills 风钻,c3 特点: 网罗性高:能形成概念网罗性高的检索标识,概括主题所涉及的各个方面,提高查全率; 专指度高:能形成专指度高的检索标识,表达主题所包含的复杂概念,提高查准率; 能形成若干检索标识,可进行多途径检索; 完善的参照系统,可帮助选准叙词,并可进行扩检和缩检。,主题语言按字顺排列,其参照系统反映的是直接上下级关系,所以无法从整体上揭示某一词族的关系,因而它所反映的族性关系不如在体系分类法中表现的充分。,3.2.3分类法与主题法的比较:,1)相同点: 都是文献信息单位广泛使用的文献信息整序法 ; 揭示和检索的对象都是各种类型的文献资料; 都是从文献资料的内容途径进行揭示和检索; 2)不同点: 揭示对象方面 使用标识方面 排列方式方面 用途方面,a.揭示对象方面:,分类法揭示的是文献内容的学科属性,处理和检索文献都必须对文献内容的学科属性作出判断; 主题法揭示文献论述的具体事物或主题概念,一般不涉及学科类别的判断。,b .使用标

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号