信息组织方法论

上传人:jiups****uk12 文档编号:45472707 上传时间:2018-06-16 格式:PPT 页数:38 大小:525.50KB
返回 下载 相关 举报
信息组织方法论_第1页
第1页 / 共38页
信息组织方法论_第2页
第2页 / 共38页
信息组织方法论_第3页
第3页 / 共38页
信息组织方法论_第4页
第4页 / 共38页
信息组织方法论_第5页
第5页 / 共38页
点击查看更多>>
资源描述

《信息组织方法论》由会员分享,可在线阅读,更多相关《信息组织方法论(38页珍藏版)》请在金锄头文库上搜索。

1、信息组织方法论刘炜第五章 主题法主题法 直接以表示文献主题的语词作标识,提供 字顺检索途径,并主要采用参照系统结石 词间关系的标引和检索文献的方法。其中 的语词可以是自然语言,也可以是受控语 言。 (p.114)主题法的特点 揭示文献的内容属性 以自然语言为基础(不用标记制度) 直接以局部(语词)指代文献 以特性检索为主,族性检索通过词间的关 联达到 以明确性的检索为主,模糊检索通过技术 的手段达到主题法的类型 标题法(Subject Heading)用规范化的自然语言语词作标题,直接表达文 献主题概念,按照标题字顺排列,并用参照系统( 已借鉴叙词表的参照关系:用代属分参)显示标题 之间关系。

2、 最早产生(1876年克特出版字典式目录规则 ) 标题含义明确、易于使用 标题列举、先组式,概念表达能力有限,难以 多向成族,检索途径少,标识的通用性差(由于采 用自然语言?) 单元词法Uniterm又称元词法,以取自自然语言、经过规范化处 理的语词作标识,通过子面组配表达主题。 最基本的、概念上不可再分解的词,表示文献 主题 克服标题不足 后组式,易轮排(每个词)索引,灵活 20世纪50年代用于穿孔卡系统(最早的机检系 统) 字面分拆,语义准确性差 词间缺乏联系,缺乏参照系统主题法的类型主题法的类型 叙词法,又称主题词法Thesaurus以规范化的自然语言语词作为文献主题 的标识,通过叙词的

3、概念组配表达主题概念 。 20世纪50年代末提出。吸取了元词法、 标题法以及分面组配分类法的优点而发展起 来 能够多向成族、多检索途径、多因素组 配、灵活扩检/缩检/改变检索范围 灵活性、专指度、可扩展性俱佳主题法的类型 关键词法(又称自由词) 直接以文献中能够表达主题概念的关键 词作为标识。来自于计算机自动抽词 关键词:出现在文献的题名、文摘、正 文中,能够表达文献主题,具有检索意义的 语词。 自然语词,不做规范化处理(不受控) 无词间关系,但编制禁用词表 现在计算机也能结合一定的受控功能, 以提高检索的准确性叙词法的综合性 与元词法和标题法一样采用自然语言,但规范控制严格 ,保证标识与概念

4、的唯一对应; 适当采用标题法的预先组配,而不是元词法尽可能细分 ,以表达组合、专有概念,减少组配误差; 借鉴分面组配分类法,采用概念组配而不是字面组配; 完善了标题法的参照系统; 采用体系分类法的叙词分类索引和等级索引(词族索引 ),甚至直接引入体系分类表或分面分类表,实现分类 主题一体化; 采用关键词法的轮排方法,编制叙词轮排索引主题法的功能 对信息内容进行标引的功能(指代用以检 索); 对主题内容及其相关信息予以集中或揭示 相关性的功能; 对大量信息加以系统化或组织化的功能; 便于将标引用语与检索用语进行相符性比 较的功能叙词表 叙词表是词汇控制(vocabulary control) 的

5、工具之一。 叙词表是索引用语及检索词汇的 authority list。 叙词表是由已知的概念查得代表该概念 的适当用语。concept term 叙词表透过标准化词汇的选用,使同一 概念产生类聚(grouping)的作用。汉语主题词表 1975 年,中国情报所、北京图书馆、国防科工 委情报所、电子科技情报所、六二八所、机械 科技情报所等单位组建全国1048个单位、7519 人参加的汉语主题词 表研究编辑工作,是 全国汉学信息处理系统工程(简称748工程)的 组成部分,目的是建立全国统一的联机情报检 索网络。该主题词表是中国第一部大型综合性 检索工具书,全书包括主表、附表、词族索引 、范畴表、

6、英汉对照索引等、共分3卷10个分册 。其收词范围之广、编辑技术之先进、结构体 系之严谨,当时是国内 外一流的。该成果获 1985年国家科技进步二等奖。 叙词表详解 (略)Introduction Thesaurus 的原义为:Treasury, Collection 通常用于同义字字典。 “A book of words and their synonyms”(Merriam- Websters Dictionary) “A book of words that are put in groups together according to connections between their

7、meanings rather than in an alphabetical list.” (Longman Dictionary of Contemporary English) e.g., Rogets Thesaurus of English Words and Phrases 1957AD H. P. Luhn最早以Thesaurus代表主題索引 用语词典(简称叙词表),并以之为词汇控制的工 具。(一說Brownson于1957正式使用叙词表一詞)叙词表的简要历史 1959年杜邦公司的工程信息中心开发了首个实用的序 词表 1960 the Armed Services Technic

8、al Information Agency (ASTIA) produced the Thesaurus of ASTIA Descriptors 1961 the American Institute of Chemical Engineers (AIChE) published the Chemical Engineering Thesaurus 1964 the Engineers Joint Council (EJC) published the Thesaurus of Engineering Terms 1967 Thesaurus of Engineering and Scien

9、tific Terms (TEST)Brief History (cont.) 1967 the Committee on Scientific and Technical Information (COSATI) published the first set of guidelines for thesaurus construction 1970 Unesco Guidelines for the Establishment and Development f Monolingual Scientific and Technical Thesaurus 1974 ANSI (Americ

10、an National Standards Institute) Z39.19 a US national standard for thesaurus construction 1974 the first international standard for thesaurus construction ISO 2788 采用叙词表的目的采用叙词表能够促进文本标引和后控情报存储和检索系统的一致性 ,并能够利用规范词进行搜索“Its purposes are to promoted consistency in the indexing of documents, predominantly

11、 for postcoordinated information storage and retrieval systems, and to facilitate searching by linking entry terms with descriptors” (ANSI Z39.19-1993, p. 38) 采用叙词的四个主要目的Four principal purposes are served by a thesaurus: n翻译Translation. 把作者、标引者和用户使用的自然语言 翻译成受控规范词汇To provide a means for translating t

12、he natural language of authors, indexers, and users into a controlled vocabulary used for indexing and retrieval. n一致性Consistency. 促进标引用词的一致性To promote consistency in the assignment of index terms. n建立关系Indication of Relationships. 建立语词之间的语义 联系To indicate semantic relationships among terms. n检索Retri

13、eval 充当文献检索的辅助工具To serve as a searching aid in retrieval of documents. (ANSI Z39.19-1993, p. 1)词汇控制信息控制和使用词根的需求来自于对自然语言两 个缺点的克服: 多词一意Synonyms different terms representing the same concept 一词多义Polysemes a word with multiple meanings in spoken language, polysemes are homonyms; in written language, the

14、y are homographs terms with the same spelling representing different concepts. Only the latter is relevant to thesauri.词汇控制(续)叙词表的词汇控制通过三种方法达成: Vocabulary control in a thesaurus is achieved through three principal means:n范围、含义说明the delineation of the scope, or meaning, of descriptors Scope Note (SN)

15、范围说明n同义词和近义词通过“等价关系”联系起来the linking of synonymous and nearly (quasi) synonymous terms through equivalence relationship USE and UFn通过修饰揭示同形异义情况the disambiguation of homographs Qualifier (Source: ANSI Z39.19-1993, p. 1)结构和关系 叙词表必须能够揭示其所含叙词之间的结构关系An intrinsic feature of a thesaurus is its ability to di

16、stinguish and display the structural relationships between the terms it contains. 叙词表内两类广义的关系There are two broad types of relationships within a thesaurus: 微观层次个体词之间的语义联系Micro Level the semantic links between individual terms 宏观层次词和词间关系与主题领域的 整体结构相关Macro level how the terms and their inter-relationships

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号