文档详情

信息组织(第五章)

平***
实名认证
店铺
PPT
9.14MB
约141页
文档ID:46314594
信息组织(第五章)_第1页
1/141

信息组织 第五章第五章 信息组织的技术方法:主题法第一部分第二部分第三部分第四部分第五部分第六部分5.1主题法概述•主题法同分类法,也是从内容角度标引和检索信息资源的技术方 法 •5.1.1主题法与分类法 •1.概念 •主题:是指信息资源论述的主题对象,包括事物、问题、现象等 •主题词:经过选择,用来表达信息资源主题的语词 •主题法:是指直接以表达主题内容的语词作检索标识、以字顺( 语词)为主要检索途径,并通过参照系统等方法揭示词间关系的 标引和检索信息资源的方法包括实体整序和主题标引) •主题标引:是指对信息进行主题分析,用主题语言表达分析出的 主题,赋予信息主题检索标识的过程• 2.主题法的特征: 1.直接以语词作为检索标识2.以字顺作为主要检索途径3.以特定的事物、问题、现象,即主题为中心集中信息 资源4.通过详尽的参照系统等方式揭示主题词之间关 系• 3.主题法与分类法的比较: • 同:作用相同,都是用来处理信息资源, 编制检索工具和检索系统的 • 都可以揭示信息内容,只是角度不同 • 都以信息的主题分析为基础,并赋予检 索标识 • 有专门的语言工具• 异: • 表达主题概念的形式和效果不同。

• 揭示信息内容的角度不同分类号、主题词 • 标引方法不同分类标引、主题标引 • 发挥作用的范围和重点不同 • 主题法的最大特点(优点):按主题集中信息 ,检索的直接性、专指性强(适用于专题检索 ),与分类法互补5.1.2主题法的类型1、按选词方法分 :1)标题法:是一种以标题词作为主题标识 ,以词表预先确定的组配方式标引和检索 的主题方法标题词:经过词汇控制,用来标引信息的词 或词组,通常为比较定型的事物名称比 如:造血障碍性贫血、捕获粒子不稳定性 、橡胶工业、工业用橡胶①优点:采用列举式词表,形式直观;采用 定组式标题结构固定,含义明确;按照词表 列举的标题和副标题进行标引,操作简便; 主要通过参照方式对词汇进行控制,并揭示 标题之间的相关性②不足:由于采用尽量列举先组的多元词或 词串方式,往往造成收词量巨大、专指度不 足、修订量大等问题;同时,大量采用定组 式标题,使用手工检索工具时只能从规定的 顺序入手进行查找,无法从多个因素、角度 检索,必然影响检索效果2)元词法:是以最小单元词(元词)为主 题标识,通过字面组配的方式表达信息主题 的方法元词:是用来标引信息主题的、最 基本的、字面上不能再分的语词。

比如:知 识管理,要分成:知识 管理①优点:词表体积小;标引专指度高(后 组);便于从不同主题词反映、查找信 息内容;适合对专指主题进行标引②不足:直接性差,不适宜用于查找论述 单个单元主题(不与其它词组配)的信 息,(为什么?)如“科技”、“经济”, 即:单个单元词下会出现大量相关记录 ;采用字面组配方法,在字面分解与语 义分解不一致时容易造成误差,使得信 息归入与内容不相关的语词之下,如:“ 猎户星座”、“橡胶工业”3)叙词法:是以从自然语言中精炼出来 的、经过严格处理的语词作为信息主题 标识,通过概念组配方式表达信息内容 的方法叙词:是经过规范化处理的、以基本概 念为基础的表达信息主题的词和词组 比如:汽车设计,主题类型?几个主题因素,反映它们的概念 词为:?(1)元词与主题词的不同:a、概念组配与字面组配对词汇单位的要求不 同如:隧道二极管,雪崩二极管b、概念组配与字面组配的原则方法不同概 念组配需注意符合逻辑,组配用词在逻辑上是 有联系的(上下位,如教育管理学),而不是 简单的词的拆分如:胃肿瘤放射疗法,胃疾病—肿瘤—放射疗 法、肿瘤—胃疾病—放射疗法、放射疗法—肿 瘤—胃疾病,逻辑性好, 字面组配简单、直接,会不准确。

但有时一致 (2)叙词法的特点:1.结构完备,词汇控制严 格,可以根据检索系统的需要对词汇进行有效 控制(区别于自然语言);2.组配准确,标引能力强,能够专指地标引和 揭示各种主题内容(区别于元词); 3.检索效率高,可以通过灵活组配方式进行多途 径检索,达到更好的检索效果(区别于分类语 言); 4.对检索系统适应力强,可以同时适用于标识单 元和信息单元检索方式 (3)叙词法的不足:词表编制和管理难度大; 概念分析要求高标引难度大,受制于标引者的 素质和能力4)关键词法:是将信息原来所用的,具 有实质意义的词抽出,不做规范处理, 按字顺排列,以提供检索途径的方法 关键词:对描述信息主题内容具有实质 意义的语词如:“关于文献标引的方法 与步骤”,有实际意义的词是哪几个?(1)关键词法的优点:标引时不查表, 简单易行;易于实现自动化;节省了人 力和时间2)不足:检索时漏检(自然语言的原 因);机编索引情况下,不少关键词款 目不起检索作用,徒增篇幅 2、按主题法语词标识的组配特点分:1)先组定组式:是指复杂主题的标识在词 表中就已经组配好,使用时,直接从词表 的标识中选取如《中图法》.标题语言2)先组散组式:复杂主题的标识在词表中 并未组配,而在标引阶段根据标引对象的 主题需要进行组配,形成表示复杂主题的 由相关符号连接多个词的主题检索标识。

Eg:叙词表3)后组式:不仅词表中的词不先组,检索 系统中主题途径的词也不是先组式用户 检索前,主题词途径中的词是单立的,实 施检索后,用户根据需要自行辨识进行组 配后组式举例:“湖泊水污染”,在索引中:湖泊 3 6 9经济 2 5 9水污染 3 4 8 三个词后面跟着的正文(正排档)顺序号 表明,3号文献线索给出的是湖泊水污染 的文献;9号文献线索给出的是湖泊经济 3、按使用时是否进行控制分:1)受控主题法:是依据特定词表或类表 揭示信息内容的整序方法特点:标引 和检索时需根据词表将主题概念进行转 换,从而对文献内容规范表达,揭示其 相互关系,改进检索效果2)非受控主题法:是直接使用信息内容 或用户检索时使用的自然语言语词进行 的整序方法不受控,但也有规则5.2叙词语言的词汇控制 词汇控制的目的:需掌握 控制内容:词形、词义、词间关系 5.2.1词类和词组控制 1.词汇选择的原则: 2.词类控制(词性):以名词为主普通名词和 专有名词普通名词:事物名词,事物属性、状态、现 象、过程、作用等的名词,工艺、加工技术、 方法、行为的的名词,科学门类、技术部门、 理论、定理的名词,信息载体类型或形式的名 词,具有构词功能的词。

专有名词:地名,民族名和语言名,时代或年 代名,人名,机构、会议名,产品名称,历史 事件名称,法规、条约名称,名著名称有 重点的选择较有代表性的、有较大研究和检索 价值的专有名词)3.词组控制:叙词有单词和词组的形式,词组 需控制(1)词组:直接以复合概念的语词形式收入词 表的词叙词一般收单元词,有时也吸取标 题词的优点,所以优于元词法和标题词法)(2)词组控制的作用(适当的收词组):避免 使用后组词(单元词)产生的问题(问题是什 么?);提高词的专指度;保证标引的一致性 3)词组收录过多的影响:增大词量 、词表篇幅大、词表管理费用多;词 组多的检索系统会存在检索入口少, 影响查全率4)词组控制的准则: 若将词组分解 后用于组配会影响用户对其含义的正 确理解或不符合用户的使用习惯,选 词组作叙词否则,需将该词组拆分 成单词5)不应选词组作叙词的规则 : a、可由两个或两个以上具有交叉关系的已 定型简单概念词去组配表达得较复杂概 念,一般不用词组 例:喷气式垂直起落飞机,为:喷气式飞机 垂直起落飞机 b、可用代表事物与事物的方面(属性、状 态、过程、方法、工艺、材料等)的两 个概念词组配表达得较复杂概念,亦不 用那个词组。

例:汽车设计,为:汽车 设计 c、表示事物的部分,一般用表示事物整体 的词与表示部分的词组配,例:车床润滑系统,为:车床 润滑系统 d、表示文献类型的词(如:词典)一般不 与表示事物、学科或论题的词(如:情 报学)复合成词组叙词,例:档案学词典,为:档案学 专科词典e、专有名词(如:中国、陶行知)一般不与 普通名词复合成词组(如:贸易经济、教育思 想),例:中国贸易经济,为:贸易经济 中国 (6)应选用词组做叙词的规则:a、中央人民广播电台(专有名词不拆)b、捕获粒子不稳定性(太专业词不拆)c、亲属语言、蜂窝材料、期刊目录、隧道二 极管、雪崩二极管、橡胶工业、工业橡胶等, 分开产生歧义或另外的单词不再具有检索意义 5.2.2词形和词义控制:1.词形控制:保证概念与词的一致性, 具体包括以下六个方面:(1)语词形体控制:碾盘 辗盘外语词形的控制:不同拼写形式 Catalogue ,Catalog ; 可数名词多用复数 Detectors,chemical lasers ;专有名词用单 数Chemistry Viscosity (粘性);单复数都 作叙词:painting 绘画,paintings图画 (2)外来词控制:激光 莱塞 外来词原文名控制:BASIC ISBN (3)符号和数字的控制:符号只用 “( )”“—”,“.” 例:黑旗军(山东),数 字—模拟变换 , 四.一惨案;词中的数 字:如四氧化三铁,135照相机,只能用 一种表示。

4)词组叙词词序的控制:采用自然词 序 (5) 同义词控制:选较通用的作正式词:国际贸易和世界 贸易 俗名与俗称用学名:乙醇和酒精全称与简称:联合国安全理事会和安理 会,大使和特命全权大使新称与旧称:经纪人和掮客产品的型号与绰号:SS-1导弹和“飞毛腿” 导弹(6)准同义词的控制:近义词间:废物利用和废物处理 反义词间:电性和绝缘性 光滑与粗糙过度专指词:正方形 长方形用方形 2.词义控制:是对多义词、同形异义词以及含 义不清的词进行规范处理,使其具有明确性和 单义性方法:(1)加限定词:耐受性(运动生理)耐受性(心理)此时的限定是叙词的组成部分2)使用注释:a 含义注释例 悲怆注:音乐风格b 用法注释例 电测量设备(此词只供标引和查找总论性文献)c叙词使用沿革注释 水工模拟(增词时间1989)5.2. 3词间关系控制: 必要性及目的: 方式: 词间关系包括:等同关系、等级关系、相 关关系1)等同关系:正式叙词和分正式叙词的 关系纯等同关系,如:毕业实践D 毕业设计毕业设计Y 毕业实践 组代关系,如:民法典Y 民法+法典语际等价关系,DMFD 二甲基甲酰胺二甲基甲酰胺 Y DMF 2)等级关系:属种关系,如:生物学F 动物学 古生物学动物学S 生物学整部关系,如:华北地区F 天津天津S 华北地区包含关系,如:玉米S 粮食作物 淀粉作物禾本科3)相关关系:词表或系统词量大,多因此 。

交叉概念之间的关系,信息论C 决策论相似概念之间的关系,农民起义C 农民战争对立或反对概念,民主 C 集中因果之间学科与研究对象之间事物与其动作、技术、设备之间事物与其部分之间社会团体与其相关人物之间某种行为与其受体之间某种原理、方法与其工具之间事物与其性质、特征之间5.3叙词表的结构叙词表,是一个规范化是词典,作为转化自然语 言的工具从其功能来讲,它是将文献著者、 标引者和读者的自然语言,转换成规范化的叙 词语言的一种术语控制工具;从其体系结构来 讲,这种工具实际上是以规范化的、受控的和 动态性的叙词作为基本成分,以参照系统显示 词间语义关系,并通过叙词的字顺表和辅助索 引,用于标引、存贮和检索文献的一种情报语 言词汇表 叙词表的作用:• 1.提供一种知识结构,用来揭示概念之间的关 系,帮助使用者理解知识领域的结构• 2.提供一种词汇控制工具,指导标引者和用户 使用一致的词进行标引和检索• 3.提供一种术语参照系统,使得用户可以通过 它。

下载提示
相似文档
正为您匹配相似的精品文档
相关文档