信息存储与检索基本原理 理论讲解

上传人:woxinch****an2018 文档编号:57360963 上传时间:2018-10-21 格式:PPT 页数:71 大小:277.50KB
返回 下载 相关 举报
信息存储与检索基本原理 理论讲解_第1页
第1页 / 共71页
信息存储与检索基本原理 理论讲解_第2页
第2页 / 共71页
信息存储与检索基本原理 理论讲解_第3页
第3页 / 共71页
信息存储与检索基本原理 理论讲解_第4页
第4页 / 共71页
信息存储与检索基本原理 理论讲解_第5页
第5页 / 共71页
点击查看更多>>
资源描述

《信息存储与检索基本原理 理论讲解》由会员分享,可在线阅读,更多相关《信息存储与检索基本原理 理论讲解(71页珍藏版)》请在金锄头文库上搜索。

1、1,第二章 信息存储与检索基本原理,1 信息存储过程 2 信息存储与检索基本原理 3 信息的揭示与组织 4 信息检索方法 5 信息检索效率,2,1 信息存储过程,1.1信息的搜集与选择 1.2信息的著录加工 1.3信息的标引加工 1.4信息的结构编排,3,1.1信息的搜集与选择,1、确定收集的原则 收集的学科范围 主题范围 覆盖面 信息种类 2、收集的途径 3、选择所需信息,文种 时间跨度 收集的数量 摘储率,4,1.2信息的著录加工,1、著录目的 目的是把一篇文献变成一条著录,压缩后必须能体现文献的外表特征和内容特征。 外部特征指文献上显而易见的,一般情况下不反映文献实质意义的那些特征,如书

2、名、人名、各种符号标识(专利号,标准号,文献号等)、机构名等。 内容特征指表征文献实质意义的特征,如主题词(叙词,单元词、关键词)、分类号、化学符号等。 2、著录内容 外表特征:篇名,作者,工作单位,号码,文种 出处:发表在什么刊物,刊号,卷,期,页数 内容特征:摘要 3、著录格式,5,图书著录,馆 藏 号: 4418391 文摘类型: R ISBN号: 92-828-556-S 语种: Ger 中图类号: TD94 文献题名: NMRSpekeropie zur stofflichen Charakter is ierung von Braunkohlen bei der hydrieren

3、den Veredlung 作者: Michel,D 团体作者: European Commission 国别: BE 缩称: CEC 出版日期: 1999 页: 164S,6,期刊著录,记录标识: 9807001 记录来源: JX 文献类型: 刊 文献题名: 机械零件组成编码频率分析及设计规范化通用标准化 作者: 鲍子强 作者单位: 长沙重型机器厂 母体文献: 矿山机械 卷期页码: 1997,No.12,p.3942 出版单位: 洛阳矿山机械研究所 分 类 号: 97*TD-3*12 主 题 词: 标准化,成组技术,机械零件,设计 文摘: (略),7,专利著录,发明名称: 蓖麻脱皮筛选机 范

4、畴: B07B 1/20 范畴分类: 27F 33A 13A 国别: 省市: 12 申 请 人: 刘国喜 通讯地址: (300011)天津市河西区三水南里126幢 发 明 人: 刘国喜 代 理 人: 闫俊芬 代理机构: 12100 天津市专利事务所专利代理服务部 代理机构地址: (300051)天津市和平区成都道116号 法律状态: 授权 说明书页数: 003 附图页数: 02 权 项 数: 003 文摘: (略),8,会议文献著录,论文题名: 从更宽阔的视野观察与思考冶金反应工程学问题 作者: 曲英:北京科技大学,李士琦:北京科技大学 会议名称: 第七届全国冶金反应工程学术会议 会议届次:

5、7 会议时间: 19980515 会议地点: 沈阳 会议主办者: 东北大学 母体文献: 东北大学学报(自然科学版)(第19卷增刊) 出 版 地: 沈阳 出版单位: 东北大学学报编辑部 出版时间: 19980500 页码: 13 馆 藏 号: H043339 分 类 号: TF01,N94 关 键 词: 反映工程,冶金,系统工程,可持续发展 文摘: (略),9,标准文献著录,标 准 号: GB/T 1990.2-98 发布日期: 1998-11-13 标准状态: ST 实施日期: 1999-05-01 起草单位: 中国标准化与信息分类编码研究所 标准名称: 质量管理和质量保证标准 第2部分:GB

6、/T 19001、 GB/T 19002和 GB/T 19003实施通用指南 正文语种: 汉语 英文名称: Quality management and quality assurance standards-part 2:Generic guidelines for the application of GB/T 19001、 GB/T 19002 and GB/T 19003 稽 核 项: 0 中国标准分类号: A00,10,标准文献著录(续),采用关系: ISO 9000-2-97.IDT 主 题 词: 质量管理,质量保证,质量 英文主题词: QUALITY ASSURANCEQUALI

7、TY MANAGEMENTQUALITY 国别: 中国 申 请 号: 98249276 公 告 号: 申 请 日: 19981209 公 告 日: 审定公告日: 19991110 授 权 日: 授权公告日: 19991110,11,学位论文著录,论文题目: 自控式同步电机机端电压位置监测器数字控制 作者: 刘波 授予学位: 硕士 导师姓名: 李永东 授予学位单位: 清华大学 分类号: TM762.3 馆 藏 号: Y248534 论文页数: 97 出版时间: 1999.3 主 题 词: 自控式同步电机机端电压位置监测器数字控制 文摘: (略),12,科技报告著录,TITLE: Human fa

8、ctors in aviation maintenance,phase 4 Document ID: 19950021275 N (95N27696) File Series: NASA Technical Reports Report Number: DOT/FAA/AM-95/14 Sales Agency&Price: CASI Hardcopy A09 CASI Microfiche A02 Authors: Shepherd,William T.(Federal Aviation Administration) Published: May 01,1995 Corporate Sou

9、rce: Federal Aviation Administration(Washington,DC,United States) Galaxy Scientific Corp.(Atlanta,GA,United states) Pages: 176 Contract Number: DTFA01-94-C-01013 NASA Subject Category: MAN/SYSTEM TECHNOLOGY AND LIFE SUPPORT,13,1.3信息的标引加工,1、定义 把文献的主要内容用非常简明的标识(即标志)表示出来。 标识可以是号码(分类号),也可以是科技名词或词组(主题词),

10、也可以是其它的。 2、作用 1)、相同内容的文献集中在一起,不同内容的区分开来 2)、形成有序的序列,即按一定规律排列,把存储进检索工具的著录按照一定的规律排列起来,形成有序的排检系统,这样可以提供检索途径。 3、 标引加工的类型 分类法标引 用分类号作为标识 主题法标引 用代表文献主题内容的实质性的词汇作为标识,14,1.4信息的结构编排,一般有三种排列方式 1、一条著录给一个顺序编码,号码是唯一的,按号 码顺序排列。 号码可以表示存储地址,但通过号码文献的逻辑内容体现不出来 2、分类编排,按分类号的顺序 3、按主题词的字母顺序,15,2. 信息存储与检索基本原理,2.1信息检索的过程 1、

11、分析主题内容、明确检索需要 2、提出检索提问 3、用检索语言标引检索提问 4、提问标识与系统中存储的标识进行匹配比较 5、阅读著录 6、符合要求的输出 7、检索原始文献,16,2.2信息的存储与检索的基本原理,信息 存储,收集 选择,著录 加工,标引 加工,存储 标识,信息 检索,分析 需求,检索 提高,提供 标识,检索 标识,检索 语言,存储与检 索系统进 行匹配,输出,17,外部特征,内部特征,存储过程,检索过程,文献的表面信息,如题名(书名或篇名)、著者、机构、ISBN号、专利号、报告号等。如按照篇名、著者、机构名称的字顺或汉语拼音字母顺序排列;按专利号或报告号的数字顺序进行排列等,就形

12、成了以文献外表为特征的检索途径。,文献内容中所论述的主题、观点、见解和结论等。如分类途径、主题途径等。,把大量的原始文献,根据其外部特征和内容特征进行归类、标引,形成一定的检索系统,如对文献信息进行主题分析,形成主题概念,将主题概念转换成主题标引词,对文献信息中的语言进行规范,形成标准的检索语言,存储在检索系统中。,根据检索需要,对检索课题进行主题分析,把所涉及的检索范围明确起来,形成能代表信息需求的主题概念,并将主题概念转换成信息检索语言标识,然后与存储在系统中的检索标识相比较,两者相一致时,才能达到检索目的。,18,2.3 匹配指概念的逻辑关系的匹配 1)概念逻辑的方法 2)概念的外延 3

13、)概念的内涵 4)概念的外延关系 相容关系: 同一关系 从属关系 交叉关系 不相容关系,19,3 信息的揭示与组织,3.1检索语言及其作用 3.2信息的揭示与组织的方法,20,3.1检索语言及其作用,1、检索语言的概念 检索语言是应文献信息的加工、存储和检索的共同需要而编制的专门语言,是表达一系列概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标识系统。简言之,检索语言是用来描述信息源特征和进行检索的人工语言,可分为规范化语言(例如,用词表来规范)和非规范化语言(自然语言)两类。 2、检索语言的作用 检索语言在信息检索中起着极其重要的作用,它是沟通信息存储与信息检索两个过程的桥梁。

14、1)标引文献信息内容及其外表特征,保证不同标引人员表征文献的一致性。 2)对内容相同及相关的文献信息加以集中或揭示其相关性。 3)使文献信息的存储集中化、系统化、组织化,便于检索者按照一定的排列次序进行有序化检索。,21,4)便于将标引用语和检索用语进行相符性比较,保证不同检索人员表述相同文献内容的一致性,以及检索人员与标引人员对相同文献内容表述的一致性 5)保证检索者按不同需要检索文献时,都能获得最高查全率和查准率。 3、检索语言的基本要求 1)表达性 2)简洁性 3)经济性 4)动态性 5)对于规范化语言的唯一性 6)对于非规范化语言,用自然语言也可作为检索语言,但唯一性比较差,用于计算机

15、检索还可以,因为运行速度非常快。,22,23,期刊的外部特征举例:,期刊的外表特征:期刊名、出版者、出版地、出版日期、卷期号、ISSN(国际标准刊号)、国内统一刊号(CN)、邮发代号、价格等。 ISSN号(International Series Standard Number) 是国际标准刊号的简称,由 8位数字分2段组成。 如英文期刊参考文献著录格式:Y.Gong. Speech recognition in noisy environments: A SurveyJ. Speech Commum. Vol.16,no.3, pp.261-291, Apr. 1995 其中:论文著者;论文

16、题名;刊名(外文期刊多数为斜体);卷、期号;起止页码;出版日期 再如中文期刊标准著录格式:胡翠华. 证券信息服务商业化运作研究J. 情报科学,2005(9) :12811286 ,24,图书的外部特征举例,如图书参考文献著录格式: 徐天秀.信息检索M.北京 :科学出版社 ,2006.2 参考文献中出现的图书著录格式: C.M Bishop.Neural Networks for Pattern RecognitionM. Oxford, U.K: Clarendon, 1995 参考文献中会议论文集的论文著录: R.Cole, R.Stern, and M.Lasry. Performing fine phonetic distinctions: Templates vs. featuresJ. in Inference and Variability of Speech Processes. J.Perkell and D.Klatt.New York: Lawrence Erlbaum, 1986, pp. 325-341. 例中:著(编)者;书名(一般用斜体);出版地;出版社名称;出版时间;论文著者;论文题名;起止页码。 更多参见著录格式GB/T7714-2005,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 法律文献 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号