第三讲文献信息检索原理幻灯片

上传人:E**** 文档编号:90211806 上传时间:2019-06-09 格式:PPT 页数:39 大小:947.50KB
返回 下载 相关 举报
第三讲文献信息检索原理幻灯片_第1页
第1页 / 共39页
第三讲文献信息检索原理幻灯片_第2页
第2页 / 共39页
第三讲文献信息检索原理幻灯片_第3页
第3页 / 共39页
第三讲文献信息检索原理幻灯片_第4页
第4页 / 共39页
第三讲文献信息检索原理幻灯片_第5页
第5页 / 共39页
点击查看更多>>
资源描述

《第三讲文献信息检索原理幻灯片》由会员分享,可在线阅读,更多相关《第三讲文献信息检索原理幻灯片(39页珍藏版)》请在金锄头文库上搜索。

1、第三讲 文献信息检索基本原理,3.1 文献信息检索的原理和意义,文献信息检索概念 文献信息检索,是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程,即从众多的文献信息源中,迅速而准确地查找符合特定需要的文献信息或文献线索的过程。 文献信息检索,广义上包括文献信息的存储和检索两个方面。,3.1 文献信息检索的原理和意义,存储,是指对一定数量的揭示文献特征的信息或从文献中摘出的知识、信息进行组织、加工、整序并将之存储在某种载体上,编制成检索工具或组织成检索系统。 检索,就是根据需要,利用一定的检索工具和检索手段,把所需要的文献线索或知识、信息从检索系统中查找出来的过程。,3.

2、1 文献信息检索的原理和意义,文献信息检索是文献检索和信息检索两个概念的统一 文献检索是信息检索的一种类型,是指依据一定的方法,按照一定方式将文献组织存储在某种载体上,并利用相应的方法或手段从中查出符合用户特定需要的文献的过程。 信息检索是指依据一定的方法,从已经组织好的有关大量信息集合中查出特定的相关信息的过程。,3.1 文献信息检索的原理和意义,文献信息检索的类型 1、按内容划分 (1)数据信息检索 (2)事实信息检索 (3)文献信息检索 2、按组织方式分 (1)全文检索(2)超文本检索(3)超媒体检索 3、 按检索设备分(1)手工检索(2)计算机检索,2、按组织方式分,(1)全文检索:对

3、存储于数据库中的整本书、整篇文章中的任意内容信息的信息检索,可以获取有关的章节、段落等信息,还可以进行频率统计和内容分析。 (2)超文本检索:是对每个节点中所存信息以及信息链构成的网络中信息的检索。日常浏览的网页上的链结都属于超文本。 (3)超媒体检索:对文本、图像、声音等多种媒体信息的检索,是超文本检索的补充。,3.1 文献信息检索的原理和意义,文献信息检索的原理 文献信息检索的全过程包括存储和检索两个过程 一、 存储过程就是按照检索语言将原始文献信息进行处理,为检索提供经过整序的文献信息集合的过程。 文献信息的存储包括对文献信息的著录、标引以及编排正文和所附索引等。 文献信息的著录,是按照

4、一定的规则对文献信息的外表特征和内容特征简明扼要的表述 文献信息外表特征包括文献信息的著者、来源、卷期、页次、年号、文种等。文献信息内容特征包括题名、主题词和文摘。,3.1 文献信息检索的原理和意义,文献信息的标引,就是文献信息的内容按一定的分类表或主题词给出分类号或主题词。 二、检索过程则是按照同样的检索语言(主题词或分类表)及组配原则分析课题,形成检索提问标志,根据存储所提供的检索途径,从文献信息集合中查找与检索提问标志相符的信息特征标志的过程。,3.1 文献信息检索的原理和意义,存储过程 文献内容 主题概念 信 文献特征标志 信 息 息 检 检 检索结果 索 索 语 工 检索过程 检索需

5、求 主题概念 言 提问特征标志 具,3.2 检索语言,检索语言的概念和作用 检索语言(retrieval language)是一种人工语言,它是各种信息组织、存储和信息检索时所用的一种语言。(在文献信息存储于检索过程中共同使用、共同理解的统一的标志) 检索语言的作用是标引文献内容、数据和其他信息,把信息的内容特征及其外表特征简明而有效地揭示出来;是连接标引人员和检索人员的思想桥梁,是标引人员和检索人员之间共同遵循的标准语言。保证了文献信息存储的集中化和系统化,并使众多的文献信息高度的标准化、集中化和系统化,避免检索的漏检和误检,是有规律的检索成为可能。,按描述文献特征的不同分,描述外表特征,描

6、述内容特征,题名(书名、篇名)、著者姓名、号码(专 利号、报告号、标准号等)和引文语言 (被引用著者姓名和被引用文献的出处),分类检索语言,主题词检索语言,代码检索语言,体系分类检索语言,组配分类检索语言,混合分类检索语言,标题词检索语言,关键词检索语言,叙词检索语言,单元词检索语言,3.2 检索语言,检索语言种类 1、分类检索语言 按其所属的学科性质进行分类和排列,以阿拉伯数字或拉丁字母和数字混合作为类目标志符号,以类目的从属关系表达复杂概念及其在系统中的位置,甚至还表示概念与概念之间关系的一种检索语言。,(1)体系分类语言 一种直接体现学科知识分类的等级制概念的标识系统,是通过概括性文献信

7、息内容特征进行分类的检索语言。 图书分类法: 中国图书馆分类法(中图法)、 中国科学院图书馆分类法(科图法)、中国人民大学图书馆分类法(人大法),中国图书分类法,A 马列主义,毛泽东思想 B 哲学 C 社会科学总论 D 政治,法律 E 军事 F 经济 G 文化,教育,科学,体育 H 语言,文字 I 文学 J 艺术 K 历史,地理,N 自然科学总论 O 数理科学和化学 P 天文学,地球科学 Q 生物科学 R 医药,卫生 S 农业科学 T 工业技术 U 交通运输 V 航空,航天 X 环境科学 Z 综合性刊物,T 工业技术 TB 一般工业技术 TD 矿业工程 TE 石油、天然气工业 TF 冶金工业

8、TG 金属学与金属工艺 TH 机械、仪表工业 TJ 武器工业 TK 能源与动力工程 TL 原子能技术 TM 电工技术 TN 无线电电子学、电信技术 TP 自动化技术、计算机技术 TQ 化学工业 TS 轻工业、手工业 TU 建筑科学 TV 水利工程,3.2 检索语言,F 经济 F7 贸易经济 F71 国内贸易经济 F710 贸易经济理论与方法 F711 贸易经济结构、体制 1 资本主义所有制 2 商业的社会主义改造 3 社会主义所有制 4 商品调拨 F712 贸易计划于管理体制 . 选自中国图书馆分类法第四版,3.2 检索语言,(2)组配分类检索语言 运用概念可分析和综合的原理,将可能构成文献主

9、题的概念分析成为单元和分面,设置若干标准单元的类表。使用时,先分析标引对象的主题,根据主题分析的结果通过相应概念类目的组配表达主题内容,以这些类目的标志组合,表示该项主题在分析体系中的次序。,3.2 检索语言,(3)混合式分类检索语言 既应用概念划分和概念原理,又应用概念分析和综合的原理而编制的分类法。,3.2 检索语言,2、主题词检索语言 经过选择,用于表达文献信息内容的词语作为概念标志,并将概念标志按字顺排列组织起来的一种检索语言。 (1)标题词检索语言 经过标准化处理的表达文献所论述或涉及的事物概念的词、词组或短句作为标志的一种用检索语言。 (2)叙词检索语言 从文献中优选出来,经严格规

10、范化处理的名词或名词词组,通过组配来标示文献内容或主题的一种标志系统。,3.2 检索语言,叙词(Descriptor)是指描述文献主题内容的规范词。即它是指从文献内容中抽出来的,能概括表达文献内容基本概念的并经过规范化的名词或术语,是受控词(Controlled Language )。 如:“反坦克地雷”“反坦克武器”和“地雷” “高空超音速飞机”“高空飞机”和“超音速飞机” “电子计算机”“电子”和“计算机” “运输飞机设计”“运输飞机”和“飞机设计” 叙词语言的特点:规范性和概念性 如:“树林”同义规范为“森林” “模型(铸造)”“模型(数学)”词义规范,3.2 检索语言,全世界已有 50

11、0多种叙词表。它们大体上可以分为两类:综合性的和专业性的。 综合性叙词表中比较有影响的是美国工程与科学主题词表和日本科学技术情报中心主题词表;专业性叙词表有美国的航空和航天局主题词表、国际核情报系统主题词表、英国的电机工程师协会主题词表等。 中国有60余部叙词表,其中综合性叙词表有汉语主题词表和国防科学技术主题词典;专业性叙词表有航空科技资料主题词表、电子技术汉语主题词表、化学工业主题词表等。,3.2 检索语言,(3)关键词检索语言 (keywords)出现在文献标题、文摘、正文中对表达和揭示文献内容具有实质意义的词语、关键词作为检索语言. 它是没有经过规范化处理的自然语言,属非受控语言(Un

12、controlled Language) 大话西游、windows、911、F-1赛车,3.2 检索语言,(4)单元词检索语言 单元词从文献中抽取出来最基本的、不能再分割的单元词语的一种检索语言,又称元词。经过规范能表达一个独立的概念。词之间可灵活组配,来标引文献的主题概念,又称为后组式检索语言。 “计算机”和“软件”,3.2 检索语言,3、代码检索语言 对文献所论述事物的某一方面的特征,用某种代码系统加以描述和标引的语言。 例如化学物质的分子式、化学物质登记号、基因符号等。,国务院公文主题词表,01综合经济(77个) 01A计划 规划 统计 指标 分配 统配 调拔 01B经济管理 经济 管理

13、 调整 调控 控制 结构 制度 所有制 股份制 责任制 流通 产业 行业 改革 改造 竞争 兼并 开放 开发 协作 资源 土地 资产 资料 产权 物价 价格 投资 招标 经营 生产 转产 项目 产品 质量 承包 租赁 合同 包干 国有 国营 私营 集体 个体 企业 公司 集团 合作社 普查 工商 商标 注册 广告 监督 增产 效益 节约 浪费 破产 亏损 特区 开发区 保税区 展销 展览 商品化 横向联系 第三产业 生产资料,3.3 检索系统,检索系统概念 为了满足各种各样的信息需求而建立的一整套信息的收集、整理、加工、存储和检索的完整系统。 检索系统的分类 1、手工检索系统 由手工检索设备(

14、书本式目录、文摘、索引、卡片柜等)、检索语言、文献库等构成,以人工方式查询和提供文献信息。 (1)文献筛选子系统(2)词表子系统(3)标引子系统 (4)查寻子系统(5)用户与系统间交互子系统(6)匹配子系统,3.3 检索系统,2、计算机检索系统 计算机检索系统又称为现代化检索系统,是利用计算机技术、电子技术、网络技术等,存储和检索在计算机或计算机网络内的信息资源的检索系统,存储时,将大量的信息资源按一定的格式输入到系统中,加工处理成可供检索的数据库。 计算机检索发展概况: (1)脱机检索阶段(20世纪50年代中期60年代中期) (2)联机检索阶段(20世纪60年代中期70年代中期) (3)光盘

15、数据库检索阶段(20世纪70年代80年代末) (4)网络化检索阶段(20世纪90年代初今),3.3 检索系统,计算机信息检索的概念与原理: 计算机信息检索是指以计算机技术为手段,通过计算机软件技术、网络和数据库及通信系统等现代检索方式进行信息检索的,检索过程是在人机的协同下完成的。 人们在计算机或计算机检索网络的终端上使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出所需信息,然后再由终端设备显示和打印的过程。,3.3 检索系统,信息存储 信息检索 原始信息 信息需求 主题 分析 主题 分析 信息主题 检索语言 检索主题 著录 标引 选定 编制 数据库记录及信息特征标志 检索提问及提问标志 计算机 检索结果,3.3 检索系统,计算机检索的类型 (1)脱机检索(2)联机检索 (3)视频数据检索(4)网络信息检索 计算机信息检索的特点 (1)检索途径多(2)新颖性(3)高效性(4)灵活性 (5)广泛性,3.4 检索工具,检索工具的概念和特征 检索工具是经过对文献信息一系列的判断、选择、组织、加工等处理后形成供检

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号