信息存储与检索

上传人:jiups****uk12 文档编号:37785724 上传时间:2018-04-22 格式:DOCX 页数:10 大小:37.45KB
返回 下载 相关 举报
信息存储与检索_第1页
第1页 / 共10页
信息存储与检索_第2页
第2页 / 共10页
信息存储与检索_第3页
第3页 / 共10页
信息存储与检索_第4页
第4页 / 共10页
信息存储与检索_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《信息存储与检索》由会员分享,可在线阅读,更多相关《信息存储与检索(10页珍藏版)》请在金锄头文库上搜索。

1、第一章第一章1.1.信息的涵义信息的涵义: 申农(信息论创始人):用于消除随机不确定性的东西(信源、信宿) 广义信息是物质、能量存在和运动状态的表征. 狭义信息是人类社会共享的一切知识、学问以及从客观现象中提炼出来的各种 消息的总和,即现代信息 2.2.资源的涵义资源的涵义 资源是一切被人类开发和利用的客观存在。 3.3.信息资源的涵义信息资源的涵义 狭义指文献资源或数据资源,抑或各种媒介和形式的信息的集合,包括文字、 声像、印刷品、电子信息、数据库等。这都是限于信息的本身。 广义信息资源是信息活动中各种要素的总称。这既包含了信息本身,也包括了 与信息相关的人员、设备、技术和资金等各种资源 (

2、1)原始数据与信息的区别原始数据经过加工处理变为信息 (2)信息与信息资源的区别经过加工、可被利用的信息称为信息资源。 information resource 为复 数时,常指信息及与信息有关的设备、人员等集合,是经过人类选取、组织、 序化的有用信息的集合。 (1)信息资源是信息的集体; (2)信息资源是经过人类选择、获取的有用信息的集合; (3)信息资源是经过人类组织序化的信息的集合。 4.4.信息的基本性质信息的基本性质 (1)信息是内容是客观的(2)信息的形式是主观的(3)信息是一切物质的基 本属性 5.5.与信息有关的概念与信息有关的概念 (1 1)知识。)知识。 是对客观事物规律性

3、认识,是系统化和精炼化的信息 知识的三种存在方式:大脑、实物、文献 知识的七个特征:不可替代性 不可相加性 不可逆性 不可磨损性不 可分性可共享性无限增值性 知识分类:事实知识(Know What)原理知识( Know why)技能知识( Know how)人力知识( Know who)时间知识( Know When)空间知识 ( Know Where)数量知识( Know Quantity ) (2 2)文献。)文献。是记录知识的一切载体,即用文字、图形、符号、或声视频等记录 方式在一定介质上所生成的物质成果 文献的三要素:记录、知识、载体 文献的功能:存储功能 传递功能 认识功能 (3 3

4、)情报。)情报。指为一定目的而搜集和传递的有特定效用的知识 情报的基本属性:传递性、效用性 6.6.信息资源的基本特征信息资源的基本特征 (1)普遍性(2)传递性(3)时效性(4)价值性(5)可转换性(6)可利用 性(7)可共享性7.7.按性质划分按性质划分 (1)自然信息资源(2)社会信息资源 按信息包含范围划分 (1)广义信息资源(2)狭义信息资源 按信息资源的载体 (1)印刷型信息资源(2)微缩型信息资源(3)声像性信息资源(4)电子型 信息资源 按内容 (1)文献型信息资源(2)数据型信息资源(3)多媒体信息资源 按保密程度 (1)公开性信息资源(2)半公开性信息资源(3)非公开性信息

5、资源 按表现形式 (1)文字性信息(2)图像性信息(3)数值数据性信息(4)语音性信息 按信息资源的加工程度 (1)一次信息(2)二次信息(3)三次信息 按传输方式 (1)网络信息资源(2)非网络信息资源 按数据资源信息的生产途径和发布范围分 (1)商用电子资源(2)网络公开学术资源(3)特色信息资源 8.8.信息素质教育信息素质教育 信息素质教育: 是从各种信息资源中检索、评价使用信息的能力。是培养信息意识的一条重要 的途径。 9.9.电子信息资源含义与特点电子信息资源含义与特点 (1) 、存储形式多样化,文本、超文本、多媒体、超媒体(2) 、资源数字化 (3) 、交流程度高(4) 、提高利

6、用率(5) 、内容丰富(6) 、载体容量大 10.10.网络信息资源的类型网络信息资源的类型 按照网络传输协议不同分 (1)Web 信息资源:通过 HTTP 在网上传输 (2)Telnet 信息资源:基于网络通讯协议 (3)FTP 信息资源:通过 FTP 协议可完成完整的文件拷贝 (4)用户服务组信息资源:由一组对某一特定主题有共同兴趣的网络用户组成 的电子论坛。 (5)Gopher 信息资源:Gopher 是一种基于菜单的网络服务,允许用户以一种 简单的、一致的方式快速找到并访问所需的网络资源。 按信息传播交流过程分 (1)稳定的电子信息资源 (2)不稳定的电子信息资源 按网络信息资源的表现

7、形式分 (1)电子图书型(2)电子期刊型 (3)电子报纸型 (4)联机系统与联机数据库(5)数字图书馆 按照存取方式分 (1)邮件型(2)电话型(3)揭示板型(4)广播型 (5)图书馆型(6)书目型(7)交互型 按电子数据库内容分(1) 参考数据库(2) 源数据库 (3)混合型数据库(1)参考数据库指导用户到另一个信息源中获取原文或其他细节的数据库。 分为: 书目数据库和指南数据库 指南数据库(REERRENCE DATABASES)也称指示性数据库,是指存储关于某些机 构、人物、出版物、项目、程序、活动等对象的简要描述,指引用户从其他有 关信息获取更详细的信息的一类数据库。 如产品目录、机构

8、名录、研发项目、基金项目等数据库均属于此类型。 (2)源数据库(source databases): 直接提供原始资料和具体数据的数据库全文数据库 数值数据库 科学技术数据 统计数据库文本-数值数据库 公司信息库 产品市场数据库 术语数据库汉语主题词数据库 图象数据库 建筑图纸数据库 (3)混合型数据库磁媒体数据库 光盘数据库 多媒体数据库 11.11.网络信息资源的特征网络信息资源的特征 (1) 、信息内容丰富(2) 、信息变化频繁(3) 、信息结构复杂(4) 、格式多样 化 (5) 、信息价值不一 网络信息资源的发展变化 (1) 、网络信息资源数量规模的急剧增大(2) 、信息资源内容趋于规

9、范 网络信息资源的评价 (1)资源内容评价指标数据库的规模数据库的范围数据库的质量控制 数据库的实效性 (2)信息组织管理的评价指标信息收集方法信息更新周期信息管理方式 (3)信息检索功能的评价指标布尔逻辑检索精确检索截词检索 (4)检索结果评价指标结果满意度相关性排序显示内容形式 印刷型信息资源的特点 (1)实用性:携带、书写、保存方便 (2)直观性:阅读不需借助计算机等工具。 (3)不可替代性:以纸质为载体的艺术作品的不可替代性 (4)增值性:质文献作为收藏品的不可替代性 按文献的加工深度划分 零次文献:指未经公开交流的最原始的文献。如论文手稿、新闻稿、未审核的 工程图纸、实验记录、会议记

10、录。 特点:内容庞杂,来源真实,成熟度差 一次文献:以著者本人的研究成果为依据而形成,并在社会上公开交流或发表 的文献。如期刊论文、研究报告、预印本、会议论文、专利说明书、学位论文、 技术标准等。 特点:零散、无序、难获取 第一,创造性;第二,原始性;第三,多样性; 二次文献:是把分散、无组织一次文献进行收集、加工、整理压缩而形成的并 能按期外部特征提供查找线索的文献形式。如目录、题录、文摘、索引等 特点:第一,集中性;第二,工具性;第三,系统性; 三次文献:利用二次文献对一次文献进行综合、归纳和分析的基础上而形成的 述评性、综述性文献形式。 特点: 第一,综合性;第二,针对性;第三,科学性;

11、 12.12.其他载体文献信息资源其他载体文献信息资源 印刷型文献信息资源特点:存储密度小、占据空间大、阅读携带方便 微缩型文献信息资源特点:存储密度小、占据空间大、阅读携带方便 声像型文献信息资源特点:直观、形象 电子型文献信息资源特点:存储密度高、存取快、数据可修改、删除、更新第二章第二章1.1.信息存储与检索概念信息存储与检索概念 (1).广义信息检索:指将信息按有序的方式组织和贮存,并根据用户的需求 查找出有关信息的过程。包括存入和输出两个方面。 (2).狭义的信息检索:单指查寻信息的过程,即从信息集合之中查寻出所需 要的符合要求的信息的过程。 (3).信息存储:是按主题词表或分类表及

12、使用原则对原始信息资源进行处理, 形成信息特征标识,为检索提供整序(即提供检索途径的)的信息集合的过程。(4).信息存储与检索的基本原理:查询语言(检索提问)和系统标识语言所进 行的“相符性比较”与“匹配运算” 。 (5).直接检索: 直接从信息源或信息文献载体中获取信息 (6).间接检索: 通过检索工具指引来获取所需信息。 (7) 、信息检索通常包括 4 种类型: 一是关于文献的检索;二是关于某事实或事项的知识检索;三是关于数值或数 据的情报检索;四是关于图象信息的信息检索。 2.2.信息存储信息存储 (1).信息的印刷存储 特点:直观易读、携带方便。缺点:存储信息密度低、存储传输慢,难以长

13、期 保存 (2).信息的微缩存储 特点:容量大、密度高,忠实于信息原件、不出差错;成本低、保存时间长 (3).信息的磁存储 (1)磁存储的特点 能存储一切可转换成电信号信息。文字、声、像;可长久保存、重复使用、可 擦写;可同时进行多路信息存储,并保证信息之间的时 间和位相关系;存储频 带宽广;可高速存储高频信息慢速播放或慢速存入低频信息快速播放 (2) 磁存储类型 计算机磁带 硬盘软盘 光盘 温盘 (4) ,半导体存储 是采用集成化的技术将存储单元电路及其外围电路直接置放在半导体芯片上支撑的。 (5) ,光盘存储 特点:信息存储密度高 价格低 方便存取、方便与计算机连接 显示信息种类多 坚固耐

14、用,存储寿命长 计算机的存取技术与设备 网络存储 3.3.按检索活动的执行主体按检索活动的执行主体 手工检索手工检索 利用人工信息存取系统检索信息的活动,如各类纸质书目、索引、文摘、卡片 检索过程:人工的手翻、眼看、大脑分析和判断 优点:不需要辅助设备,适应性好成本低,检索工具可长期无限制使用 检索前随时获得反馈信息,及时修改检索策略可以把几种检索工具进行对比 参照。 缺点:费时费力检索工具提供检索点有限,主题专深文献 按检索工具类型按检索工具类型 (1)目录与题录检索 (2)文摘检索 (3)字典型检索 (4)交互式检索 (5)索引检索 按照检索方式划分按照检索方式划分有先组式索引和后组式索引

15、。 按照索引所包括的对象划分按照索引所包括的对象划分 有综合索引和专门索引 依据索引标题词的性质划分依据索引标题词的性质划分 有揭示信息资源内容特征的主题索引、分类索引、关键词索引、分子式索引、 结构式索引; 有揭示信息资源形式特征的题名索引、人名索引、物名索引、代码索引、引文 索引。 依据索引标题词的排序方式划分依据索引标题词的排序方式划分 有按照标题词字顺组织的主题索引、题名索引、人名索引、关键词索引、语词 索引等; 有按照文献代码组织的报告号索引、合同号索引、标准号索引等; 有按其它排序方式组织的网络信息自动索引、重量索引、速度索引、专用索引 等 4.4.主题索引优缺点主题索引优缺点 (

16、1)能把属于不同学科、不同知识体系中论述的同一主题的资源集中标引出来, 届时资料比较深入、广泛。 (2)查考文献资料时,需要正确选取主题词,否则难以准确查到 5.5.关键词索引自然语言检索标识;自然语言多指关键词,直接从文献篇名、正 文或文摘中抽取,未经优选和规范化自然语言检索优点自然语言检索优点 (1)不受词表控制,能及时检索到最新概念的各类文献 (2)可任意选取专指性强的语言,提高查准率 (3)非受控词具有数量大的特点,比叙词表大 23 个数量级。 (4)避免在标引人员和用户之间造成不必要的交流障碍 自然语言检索缺点自然语言检索缺点 (1)不规范,存在大量同义词、多义词和含义模糊现象。 (2)没有显示词语之间的关系规范语言检索标识。 6.6.组配索引组配索引 1 按组配方式 (1)先组式检索语言 指检索前,检索词已被预先组配好的一种检索语言 分为定组型和散组型编制检索语言词表的时已经

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号