电子文件的检索

上传人:ji****72 文档编号:50893918 上传时间:2018-08-11 格式:PPT 页数:88 大小:215.50KB
返回 下载 相关 举报
电子文件的检索_第1页
第1页 / 共88页
电子文件的检索_第2页
第2页 / 共88页
电子文件的检索_第3页
第3页 / 共88页
电子文件的检索_第4页
第4页 / 共88页
电子文件的检索_第5页
第5页 / 共88页
点击查看更多>>
资源描述

《电子文件的检索》由会员分享,可在线阅读,更多相关《电子文件的检索(88页珍藏版)》请在金锄头文库上搜索。

1、第四章 电子文件的检索 第一节 电子文件检索概述一、电子文件检索的含义.对检索的理解有广义和狭义之分。 .存储过程:借助于一定的方法、工具,将 文件当中具有检索意义的特征,包括内容 、结构和背景持证标识出来,并组织成为 有序的、相关的数据集合予以存储; .查找过程:用户首先需确定检索途径,即 检索的角度,选择检索标识,形成最终的 检索表达式并提交给检索系统,最后系统 返回检索结果。 确定具有检索意义 的文件特征表达检索标识组织检索标识确定检索途径选择检索标识组织检索标识检索系统数据库电子文件用户需求存储于查找于电子文件检索系统二、电子文件检索的种类.(一)按计算机处理方式划分按照计算机处理方式

2、,电子文件检索可以分为 脱机批处理检索、联机检索两种。 .(二)按计算机处理技术划分按计算机处理技术划分,电子文件检索可以划 分为布尔检索、截词检索、加权检索、原文检 索、超文本检索等。三、电子文件检索与档案计算机 辅助管理中的检索的区别(一)两者的工作基础不同档案计算机检索的对象是机读目录,这些机读 目录基本上都是纸质文件目录输入到计算机后 所得,因此传统的档案计算机检索工作的物质 基础仍然是纸质文件和档案 。电子文件的检索则是以电子文件目录以及电子 文件全文为检索对象,其工作基础是电子文件 原件 三、电子文件检索与档案计算机 辅助管理中的检索自动化(二)两者的技术手段不同档案计算机检索所运

3、用的技术手段比较简单, 一般是采用单机形式,即使联网查询,也只是 档案部门内部计算机之间简单的连接。而电子 文件的检索则采用复杂得多的网络技术。 (三)两者的服务模式不同档案计算机检索采用的是以档案馆(室)为中 心的服务模式,其目的在于提高手工管理的效 率。电子文件检索采取的是一种完全以用户为 中心的服务模式。 四、电子文件检索与其他管理 环节的关系.在电子文件管理所有环节中,检索的技术 性最强,具有开放性,对新技术、信息服 务领域内的新思想吸纳较为迅速。(一)部分收集工作的内容将转由检索系 统的开发来承担。 电子文件的收集将不完全是资源的实际拥有( ownership),而是在拥有一部分文件

4、资源物理载体 的基础上,获得对其他文件资源的存取能力( accessibility)。 未来的虚拟档案馆最明显的特征就是不以实际拥有 的馆藏提供服务,而是给利用者提供一个高质量的 检索系统 四、电子文件检索与其他管理 环节的关系.(二)检索工作对整理工作提出新要求 文件和档案的整理一般分为两类:实体 整理和信息整理。 原来占很大比重的实体整理工作将弱化 、简化。 信息整理则呈强化的发展趋势,以用户 为中心的服务模式,要求检索途径必须 多元化,对于电子文件信息的分类整理 将成为管理人员的一项日常工作,整理 的结果存入检索系统之中,作为检索信 息库的基本内容。四、电子文件检索与其他管理 环节的关系

5、(三)检索工作同时包含着安全保护工作的内容检索连接文件系统输入和输出两个接口,容易出现泄密、篡改、删除 等问题,一般宜结合技术与人工干预双重手段,采取相应的安全保护 措施。安全保护措施可分为两类:第一类针对的是人员,明确各有关人员在 查找文件信息时所具有的权限;第二类针对文件,对文件的存取途径 、编辑方法做出限定。第一种方法着眼于“预防”,包括根据每一个利用者的能力及权利,分 配不同的访问权限;利用磁卡、保密字、指纹等手段对用户的物理访 问进行限制等。第二种方法的出发点则是“检查”。一般在系统中设计“ 审计追踪”的功能,自动记录访问者与文件的交互关系,系统将对每 一次访问进行记录。保护措施越是

6、严谨、详细,文件便越安全。 第二节 电子文件检索系统电子文件检索系统由共同承担检索 任务的人员、硬件、软件、信息资 源、规章、政策组成。第二节 电子文件检索系统q严格意义上的电子文件检索系统采取以用户为 中心的服务导向,必须提供统一、友好的用户 界面; q借助于检索语言和自然语言,利用数据库技术 ,高效地加工、组织、存储文件信息; q面向用户提供联机帮助,提供多样化的输出格 式。 q顺应计算机技术与通讯技术的发展趋势,电子 文件检索系统将向网络化、智能化的方向发展 ,未来的智能化的检索系统还应该提供专家系 统。第二节 电子文件检索系统q一、用户界面 .以用户为中心的管理模式,要求文件、档案管理

7、部 门必须紧紧围绕着用户的需求开展工作。由于检索 系统是所有工作内容当中惟一直接连接用户和文件 资源的一个环节,因此系统设计必须以用户的要求 为基本依据,掌握用户的心理需求特点,充分利用 电子文件信息的优势,开发出对用户友好、方便使 用的系统来。 .多媒体技术 .触摸屏技术 .虚拟现实技术第二节 电子文件检索系统二、检索语言 .检索语言是根据检索的需要而创制的、表 达文献主题概念和检索课题概念的人工语 言。 .在传统管理模式下,对于检索语言的研究 已经相当深入。档案文件的检索语言主要 包括分类检索语言和主题检索语言两类。 第二节 电子文件检索系统二、检索语言 .在电子环境下,特别是电子档案管理

8、系统 中,检索语言已有的成果可以直接移植到 计算机系统中;由于计算机技术具有重复 处理大容量信息的强大功能,电子文件检 索语言呈现出一些新的特点和趋势:第二节 电子文件检索系统二、检索语言 1.分类语言和主题语言向一体化方向发展2.自然语言和检索语言向综合应用的方向发展第三节 电子文件的著录一、电子文件著录的概念及特点q(一)电子文件著录的概念 .档案著录规则(GB/T181999)中,著录是 指“在编制档案目录时,对档案内容和形式特征进 行分析、选择和记录的过程”。 .国际档案理事会1999年9月发布的国际档案著 录(通则)ISAD (G)(第2版)中,对于“ 档案著录”的解释则为:“通过获

9、取、核对分析、 组织和记录有助于确认、管理、查询和解释档案 材料、背景及其生成时的文件系统的信息,以形 成对所描述对象及其构成部分的准确表述的过程 及成果” 一、电子文件著录的概念及特点q(一)电子文件著录的概念 .比较之下,可见国际档案著录(通则)中的著录概 念比档案著录规则中的著录概念要宽泛,所蕴涵的 管理思想也要深刻;第一,它未设定著录的预定目的是编制档案目录,表 示著录的作用不止于编制检索工具,而在于确认、管 理查询和解释档案材料、背景及其生成时的文件系统 ,指向编制检索上具背后出一些内容;第二,它认为著录内容不仅包括档案本身的特征,而 且还包括档案又背景、文件系统等;第三,它认为著录

10、不仅是一项在文件归档之后分析、 选择有记录信息的工作,而且还是对著录信息主动“获 取”的过程;第四,它肯定了著录不仅是“过程”,而且是该过程的“ 成果”。q(一)电子文件著录的概念 .加拿大不列颠哥伦比亚大学的露西安娜杜兰蒂指出 :“当利用者查考的电子文件曾经历了若干次复制 和迁移,其物理格式较原始文件基本上面目全非, 而负责复制和迁移的工作人员已经故去,无法出面 担保文件的可靠性之时,最终要依靠档案目录来评 定该信息源是否可信。通过对档案全宗的信息整理 和描述,文件编制和管理过程中的各种联系得以永 久保存,因此著录是保证文件真实性的一种可靠手 段”,同时她还强调,“只有档案著录工作才能证明

11、电子文件的长期真实性”。q(一)电子文件著录的概念 .美国电子文件研究专家戴维比尔曼认为:“ 未经恰当著录过的电子文件系统即使保存下 来,也不会有证据作用”。就著录的内容而言 ,戴维比尔曼认为,著录涉及文件形成过程 中的各个要素,包括文件形成背景、内容和 结构,而且著录的重点也从文件内容转移到 文件的形成背景上。 .电子文件的著录,是指通过获取、核对、分 析、组织和记录关于文件内容、结构、背景 以及文件系统的信息,准确描述电子文件的 过程及成果。q (一)电子文件著录的概念 .为何在著录领域出现上述变化? .主要是因为电子环境下文件及档案管理的任务发 生了变化。在手工环境下,文件管理的主要难点

12、 在于以保存场所为代表的物质资源匾乏,高密度 存储技术的出现使得保存场所的难点问题得到有 效的控制,但是电子计算机技术的广泛应用引发 了新的瓶颈,它以如何保证文件的长期真实性、 完整性为代表,在更大程度上表现为一个智力控 制问题,从而将管理人员从物质资源匮乏的窘境 中解放出来,而将注意力集中到管理思路、思想 上来。一、电子文件著录的概念及特点q(一)电子文件著录的概念 .电子文件的著录,是指通过获取、核对、 分析、组织和记录关于文件内容、结构、 背景以及文件系统的信息,准确描述电子 文件的过程及成果。 一、电子文件著录的概念及特点q(二)电子文件著录的特点 .1.全要素对于电子文件而言,需要描

13、述的对象包括文件的所有要素: 内容、结构和背景。电子文件著录全要素的特点决定了著录 的信息源不仅是文件内容本身,还包括生成、管理电子文件 的活动。 .2.全过程著录将贯穿于电子文件的整个生命周期,包括文件编制、处 理、归档、迁移、利用等全过程。 一、电子文件著录的概念及特点q(二)电子文件著录的特点 .3.综合性综合性是指著录手段的综合性。随着自动化程度的加深,人工直接著录的方式将渐渐演变为 系统自动著录和人工控制相结合,其中主要的自动化技术是 元数据技术。 .4.多级性针对不同级别的文件集合或文件,著录结果是不同的,但是 各级著录之间的有机联系应始终予以维护。 二电子文件著录的组织文件级以及

14、案卷级的著录工作一般应由电子文 件形成部门完成,著录文件与电子文件同时归 档 。北京五洲设计院的电子文件管理系统中,从设 计工作的开始阶段,设计人员必须完成由档案 部门设计的著录单(记录设计项目的名称、时 间、来源、责任者、设计者等),方可进入设 计系统的界面开始设计工作。三、电子文件的著录项目q对于某一份文件而言,其完整的著录信息包括 三个部分: .第一,存在于文件形成时所在系统(如业务处理系 统)中的关于文件背景、内容、结构、文件系统及 其相互关系的著录信息; .第二,存储于档案管理系统中关于案卷级以上的文 件集合、系统。归档后管理活动及其相互关系的著 录信息; .第三,以纸质形式存在的著

15、录信息,主要包括电子 文件积累登记表、归档电子文件登记表、文件更改 登记表、电子文件接收检验登记表、电子文件使用 权限保护登记表以及物理载体整理结果的登记表等 三、电子文件的著录项目(一)档案著录规则(DA/T181999)的规定 .所谓著录项目,是指描述文件内容、结构、背景及文件系统 信息的记录事项。档案著录规则(DA/T181999)中 规定了7项,每项分若干个著录单元(小项),包括: 1题名与责任说明项。包括正题名、并列题名、副题名 及说明题名文字、文件编号、责任者、附件六个小项。 2稿本与文种项。包括稿本、文种两个小项。 3密级与保管期限项。包括密级、保管期限两个小项。 4时间项。 5

16、载体形态项。包括载体类型、数量及单位、规格三个 小项。 6附注与提要项。包括附注、提要两个小项。 7排检与编号项。包括分类号、档案馆代号、档号、电 子文档号、缩微号、主题词或关键词六个小项。三、电子文件的著录项目(二)电子文件著录项目l题名与责任说明项 l1正题名 12并列题名 13副题名及说明题名文字 14责任者 15鉴定者 16归档者 17接收归档者 18著录者 19迁移者 110附件2稿本与文种项 21稿本 22文种 23版本及版本说明 3密级与保管期限项 31密级 32文件缓急程度 33保管期限 4时间项 41形成时间或文件起止时间 42归档或销毁时间 43迁移时间三、电子文件的著录项目5载体形态项 51载体类型 52数量 53规格 54盘带号 55迁移前载体类型 56迁移前盘带号 6附注与提要项 61附注 62提要 63机构史或传记 64保存史7软硬件平台项 71机器名称及型号 72

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号