档案数字化的风险警示与对策

上传人:夏** 文档编号:509577587 上传时间:2023-02-22 格式:DOCX 页数:7 大小:15.81KB
返回 下载 相关 举报
档案数字化的风险警示与对策_第1页
第1页 / 共7页
档案数字化的风险警示与对策_第2页
第2页 / 共7页
档案数字化的风险警示与对策_第3页
第3页 / 共7页
档案数字化的风险警示与对策_第4页
第4页 / 共7页
档案数字化的风险警示与对策_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《档案数字化的风险警示与对策》由会员分享,可在线阅读,更多相关《档案数字化的风险警示与对策(7页珍藏版)》请在金锄头文库上搜索。

1、档案数字化的风险警示与对策谈胜祥近年来档案数字化工作在各级档案馆广泛地展开,数字化的含义就是将传统档案、资料的目录和全文转换成计算机网络中的数据,这些数据包含了各种门类档案目录信息和全文信息。数字化产生的数据也就是数字化成果,是建立档案信息资源的基础工作,在这个基础上,档案信息资源才能得以深度开发和利用。各级档案馆全面开展数字化工作产生的巨量数据,绝大部分是扫描电子文件,存在着长期有效保存的问题。扫描电子文件也是一种机读文件,必须依赖相应的软硬件设备。然而,计算机技术的飞速发展使得电子文件依赖的机读环境也在不断变化。如果没有一定的技术力量和信息管理机制的支撑,巨量数据将面临着技术风险和管理风险

2、,随时有可能造成数据丢失或者数据报废。深刻认识这些风险并采取避难对策,才能真正保住投入了大量人力、物力的数字化成果。一、脱机载体长久保存的技术风险目前档案馆数字化工作一般都委托给专业公司,数字化以后的扫描件一是挂接到应用系统的数据存放区域,二是刻录到光盘作为数字化工程完成的交付物。由于数据量很大,交付的光盘数量也巨大,一般都要上千张,加之有的档案馆为了保险起见,往往要求专业公司刻录三套甚至四套备份盘,这对档案馆而言实际上增加了管理负担。因为存放的光盘不仅仅是立放在库房的柜子里就相安无事,而是定期需要进行可读性检测,长期没有检测的光盘是不能保证光盘中的数据是否可读,而光盘检测又是一件费时、费力的

3、工作。回顾档案信息化进程中的数据丢失案例,对于当前正在大规模进行数字化的档案馆是一个很好的风险警示。从过去的失败中获取经验教训,避免重蹈覆辙。上世纪九十年代,上海一些区县档案馆开始了数字化扫描工作,采用了某一知名公司的软件和设备,投入了一定的人力、物力。最终这批扫描件基本废弃,因文件命名规则与数据库结构问题无法与后面开发的档案管理系统挂接,所以无法检索、利用。而原有的检索系统又存在一些缺陷,已经不适应新的计算机软硬件环境而不得不淘汰。同时,上海一些企事业系统要求财会电算化的数据向档案室移交、归档。当时使用的是五英寸和三英寸软盘,这些存放财会电算化数据的软盘随着计算机设备和财务软件更新而全部淘汰

4、,里面的数据也没有机会进行迁移。此外有的档案馆接收了统计部门或其他部门存放在软盘中的人口普查资料和其他业务数据,最终因为软盘的淘汰而造成数据全部丢失。之后存放在光盘或者磁光盘的移交数据也因为软件和硬件技术的升级而无法机读。这些案例一再说明了采用脱机载体长期保存数据会遇上技术风险,这种技术风险就是计算机软硬件发展的一个隔代不兼容性问题。虽然在电子文件保存和光盘载体管理出台了一系列的标准,但是有一个无法回避的问题,档案馆开展数字化加工的档案其保管期限一般都在三十年以上,相应的扫描件如何通过脱机载体存放这么长期限是一个未知数。对于三十年以后的计算机设备是什么状况谁也无法预测,鉴于前三十年的发展过程,

5、这些存放巨量信息的载体在三十年内被彻底淘汰是大概率事件。如果用静止的思维去制定电子文件载体保管措施,似乎像刻舟求剑?当然有不少人提出用迁移的方法解决技术更新带来的不兼容问题,但是否有人真正考量过迁移的成本和操作性。至少目前很多档案馆经过数字化后,一是迁移量很大,数据的增量都达到TB级别。二是数据结构和数据格式并不统一,这些数据相互之间都有一定的关联,例如目录信息与全文信息不在同一数据库中,而是通过标识符连接。再由于全文信息的格式很多,在原来生存的操作系统、数据库环境中实施数据从光盘或移动载体中导入到服务器与应用系统连接,有时难免出错。如果硬件设备完全更新、操作系统和数据库也同时升级更新,原数据

6、可能要进行格式转换,迁移的出错风险也会更高。因计算机技术发展引发的脱机载体的数据无效保存风险还只是一种技术风险,从现在很多领域的实际应用中,这种技术风险是可以避免的,但投入的成本也很高,需要思考的是这种高成本的数据保存方式是否适合目前各个综合性档案馆各自为阵的保管模式。二、档案馆计算机机房及信息系统正常运行的管理风险档案馆计算机机房的各项设备;包括应用服务器、数据服务器、数据备份设备、网络交换机、不间断电源、空调设备以及各类安全设施的正常运转,才能保障档案信息系统的正常运行。随着数字化工作的快速推进,档案馆数据量的急剧增大,一方面档案查询效率不断提高,另一方面管理风险也不断增加。为了合理部署数

7、据存储设备和安全因素,档案馆的信息资源的存放有在线、近线和离线三种方式,同时又不时有新增数据导入和离线数据导出。这种数据操作有的通过程序驱动相应设备自动完成,有的依靠机房管理人员手动操作。无论自动还是手动操作数据,在缺乏校验机制的情况下,数据出错的风险依然存在。 计算机机房的设备管理和数据管理,一是需要管理人员具备相应的技术能力,二是责任心,三是管理措施保障。现行机房建设的维运安全措施一般都有替代功能,当某一设备发生故障,备用的设备就会接替运行。如果有的档案馆没有这种安全措施,服务器崩溃影响档案馆正常工作的风险是很高的,严重的可导致数据丢失。虽然发生火灾、地震、或恐怖袭击等极端情况的概率很小,

8、万一真的极端情况发生了,对目前一些档案馆也可能是致命的。尽管这些档案馆采用了异地备份,通过移动硬盘甚至光盘将所有的数据下载,并送至结对的档案馆存放,以备极端情况出现以后进行数据恢复。但是这些脱机数据并未经过有效性检测,也没有进行数据复原测试,这些数据能否复原还是个悬念。更多的数据管理风险是在数据导入或通过应用系统写入或导出、删除的操作中出现了某些数据丢失和数据冗余,造成目录数据库和实体档案不能一一对应,长期操作错误的积累将导致档案利用的查全率和查准率下降,有一部分档案会因此查不到。信息系统是档案馆所有应用软件系统的总和,其中主要的风险是能否选对软件公司。低质量的应用软件故障率很高,不仅会增加管

9、理人员与软件公司交涉的精力,而且会影响整个档案局馆的工作。一旦合作的软件公司撤离或倒闭,应用软件系统得不到维护而可能导致废弃,更严重的是应用软件系统管理的数据由于加密等原因,使得后续的软件公司无法接手这些数据,造成大量全文数据的废弃。三、建立风险应对机制和档案信息资源保管体系建立风险应对机制是为了避免管理风险和技术风险,相比电子档案的保存,数字化产生的电子扫描件的保存要容易些。因为电子扫描件没有复杂的元数据羁绊,其数据的格式、应用系统的数据调用以及运行环境是可控的。档案馆在开展数字化工作之前就应该进行数据规划,确定数据长期保存和利用方式,对未来可能出现的技术风险进行评估。1、建立数据规划及实施

10、方案事实上风险应对机制是建立在风险意识之上,也就是对风险具备一定的认知能力,在可预见的情况下制定排除危机的预案。数据规划就要考虑档案馆可能产生的数据总量,每年的增量,数据的访问量、数据的格式以及数据在线、近线和离线存放的规则。一些档案馆没有数据规划,配置的存储设备或离线存储的载体过于冗余,结果不仅是浪费,而且还可能产生以为多备份几套就会保险的心理,而疏于管理。没有数据规划对设备的配置也是盲目的,例如某一档案馆数据总量不足1TB,数字化开展后每年的增量也不超过1TB,数字化的数据除了磁带、移动硬盘、同时备份几套光盘之外,又配置了20TB的磁盘阵列,这显然很不合理。根据档案馆最大数据量测算,这个磁

11、盘阵列可以用20年,且不说这个设备能否真的可以用20年,就磁盘阵列的价格下降速度几乎过二年就打对折的行情而言,浪费了大量的资金。相反大型网络数据库的使用、操作系统、WEB服务器、应用系统和硬件服务器的维护,都需要购买相应的服务,可能一些档案馆不太清楚,也没有购买相应的服务,一旦出现故障,服务器崩溃就不知所措。数据规划的实施方案是对数据安全的一种操作规定,包括数据全备、增备、异地备份的操作要求和检测要求,使档案馆管理人员对数据安全能够完全自主掌控。目前一些档案馆的数据操作还不得不依赖外包公司的技术人员,档案馆的管理人员无法真正参与数据管理,这本身就是一个很大风险。数据规划应依靠专业咨询公司帮助完

12、成,其中包含了数据总量预测、数据存储方式、数据备份策略、数据安全防范措施、数据迁移方法和突发极端事件的应对预案。2、采用技术手段进行事故报警在以往发生服务器故障造成数据丢失的事件,并非缺少备份措施和管理制度。由于很多备份设备都是无人执守,自动执行备份时,难免发生错误,但由于种种原因管理人员并未发现备份数据出错,直到服务器出了故障,数据库重新安装,导入备份数据时才发现数据有问题,为时已晚。计算机机房的正常运行,离不开弱电动力系统、空调系统、网络系统等基础设施。这些设施一旦出现故障就会影响应用服务器和数据服务器的正常工作,例如空调损坏,机房温度过高会烧毁服务器一些重要部件。将机房所有运行设备,包括

13、数据备份都连上监管系统,只要一发生故障就报警,使管理人员及时赶来处理,避免造成更大的伤害。3、研究顶层设计,突破档案信息资源长久保存的困境全国各级档案馆开展的数字化工作产生的信息量是极其巨大,目前这种各自为阵的保管模式隐含了诸多风险。当前社会信息化已经到了大数据时代,各种相应的计算机技术和存储设备也是日新月异。如何利用这些新技术解决档案数字化产生的巨量数据长久保存问题,这更需要档案行政主管部门牵头研究的。在一定的行政区域中建立这么一个档案数据中心,将分散的资源、分散的投入集中在一起,通过强大的技术力量和优越的设备条件,使得现在产生的数字化成果得以有效保存。因为随着数据量的不断增加,一般档案馆越来越难以胜任巨量数据的保管。在进行档案数字资源集约式管理的研究中,不仅要研究技术的实现方案,还要研究传统档案馆管理模式如何适应网络时代大数据管理模式。其中对于各级档案馆而言,要改变观念,需要以开放的心态共同完成档案信息资源体系的建设。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号