电子文件格式困局破解之道-电子文件格式

上传人:公**** 文档编号:564672593 上传时间:2022-09-27 格式:DOCX 页数:7 大小:19.53KB
返回 下载 相关 举报
电子文件格式困局破解之道-电子文件格式_第1页
第1页 / 共7页
电子文件格式困局破解之道-电子文件格式_第2页
第2页 / 共7页
电子文件格式困局破解之道-电子文件格式_第3页
第3页 / 共7页
电子文件格式困局破解之道-电子文件格式_第4页
第4页 / 共7页
电子文件格式困局破解之道-电子文件格式_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《电子文件格式困局破解之道-电子文件格式》由会员分享,可在线阅读,更多相关《电子文件格式困局破解之道-电子文件格式(7页珍藏版)》请在金锄头文库上搜索。

1、电子文件格式困局破解之道:电子文件格式 我们对纸质档案的阅读是不需要借助任何工具的,对电子文件的阅读则离不开计算机软硬件(或其它数字设备)。电子文件从根上说是“0”和“1”组成的编码,每一个特定的编码方案对应着一个特定的电子文件格式。格式没有统一的管理机构,也没有些人说得清世界上有多少文件格式。假如格式不透明或格式失传,那就等于没有,抑或丢失了“密码本”,电子文件会变成解不开的“死档”。对于档案界来说,怎样在管理电子文件的漫长征程中,一直将她们保持在“打得开、不跑版”的状态呢?一、限定接收格式类型遴选并限定接收进馆的电子文件格式类型是破解电子文件格式困局的第一招,这是档案部门最早使用而且沿用至

2、今的招数。“弱水三千只取一瓢饮”实乃不得已而为之,格式林林总总,此消彼长,总不能照单全收吧。因为环境不一样,选择标准不一样,偏好不一样,各国档案馆挑选进馆的电子文件格式不尽相同。2021年1月,英国国家档案馆公布电子文件管理判定和保护指南,该指南对向档案馆移交的电子文件格式进行了要求,要求这些格式比较稳定,含有较长的寿命,且能够很轻易地转化为现行的文件格式,含有潜在的“未来确保”,详细格式包含PostScript、TIFF、SGML、PDF等。马来西亚国家档案馆要求向该馆移交的电子文件必需是不绑定软硬件的简单、经济、开放、易于转换和迁移的格式,详细包含ASCII和unicode编码纯文本,和X

3、ML、SGML、PDF、TIFF、PCD、JPEG格式。美国国家档案文件管理署(NARA)最初仅接收ASCII和EBCDIC编码的平面电子文件(flatfile),其接收形式和要求以后由美国联邦法规(36CFRPart1228)形式加以要求。20212021年间,NARA依据形势发展,相继补充要求,增加接收了可带附件的电子邮件,JPEG、TIFF、PNG、GIF、BIIF格式的图像文件,XML、PDF格式的文本文件,符合地理置口号言(GML)或36CFR1228,270规范的数字空间数据,Web内容文件等。澳大利亚维多利亚档案馆接收的电子文件格式包含TXT、PDF、PDFA、TIFF、JPEG

4、、JPEG2021、MPEG4等。中国地方档案馆接收电子文件时,对格式也提出了限定。比如,青岛市电子文件归档和管理规范(试行)要求:文本文件搜集时应统一将其转换为TXT文档或XML文档,现阶段许可搜集Word97、WPS格式文档;静态图像文件搜集时应统一将其转换为TIFF、PDF、JPEG,现阶段许可搜集S2格式文档;影像文件搜集时应按MPEG2方法压缩;声音文件搜集时应统一转换为MP3格式;自主开发的计算机程序必需搜集软件的源程序及其开发、编译工具。佛山市电子文件移交格式暂行要求要求移交到市档案馆的电子文件的格式统一为:DOC、RTF、WPS、XLS、ET、TIF、JPEG、PDF。二、格式

5、转换根据一定标准遴选进馆电子文件类型,只是被动地规避格式纷繁复杂、千变万化造成的困扰。因为拒绝不合要求的格式进馆,对于处理内容主要而格式欠缺的电子文件时,会不可避免地“把孩子连同洗澡水一起泼掉”。为了有效地化解这一难题,各国档案工作者使出了第二招:格式转换。仍以英国国家档案馆为例,该馆不接收HTML格式的文件,因为她们认为,这种格式文件的标准是动态的和不稳定的,易于受到商界的压力,假如政府机关已经使用HTML格式形成文件,而且这些文件需要移交到档案馆永久保留,或需要在本单位保留,则全部必需转换成档案馆能够接收的格式。澳大利亚国家档案馆(NAA)在格式转换方面有其独特做法,积累了成功经验。NAA

6、开发了可无偿下载使用的开源软件XENA(XmlElectronicNormalisingforArchives,XMLiE规化电子文件),该软件能够检测数字对象的文件格式并将其封装转换为开放的XENA信息包用于长久保留。其软件界面见图1。和此同时,NAA还开发了可无偿下载使用的开源软件DPR(DigtalPreservationRecorder,数字保留统计器),它作为工作流软件,支撑XENA格式转换,在电子文件病毒隔离、检验和向数字档案馆保留过程中形成并留存完整的审计跟踪元数据。其软件界面见图2。格式转换已经被国际档案界视为处理电子文件长久保留和利用难题的一个基础方法。我国部分档案机构也开始

7、研究和使用这一方法,比如,南京大学档案馆就经过南大之星软件的“电子文件标准化转换中心”功效模块将多个类型的电子文件转换成PDF格式进行归档保留。沈阳市档案局则专门研发了“电子文件格式转换及归档系统”,将不一样格式的电子文件转换成统一的TIF格式,将不一样数据库文件转换成统一的XML格式。三、格式分析和注册今天,电子文件已经遍布世界的各个角落。然而,电子文件格式管理还处于无序的世界。就像每一个父亲全部有权利给自己的孩子取名一样,每一个软件企业(或有能力对数字进行编码的人)全部有可能成为格式的定义者。假如我们能够了解电话本上为何有那么多相同的人名,我们就会了解不一样格式的电子文件为何会是同一个扩展

8、名。以扩展名为,dat的文件来说,它现有可能是一个VCD的视频流文件,可用视频播放器打开,还有可能是杀毒软件病毒库或软件资料类的数据文件,可用记事本或专用软件打开。对于管理者来说,怎样正确地域分和利用类似,dat这么的电子文件呢,IT教授和档案工作者们想出了第三招:格式注册。格式注册通俗地说就是给格式“上户口”。现在,世界上的电子文件格式注册系统关键有:(1)多用途网际邮件扩展协议媒体类型注册(MIMEMTR,MediaTypesRegistry)。由Internet编号分配机构(IANA,InternetAssignedNumbersAuthority)维护管理,提供Internet上文件格

9、式的权威定义和相关参数信息。其登记的属性包含:MIME类型名称、必备参数、可选参数、编码要求、安全要求、互操作要求、公布说明、所支持的应用、联络人等。MIMEMTR支持在线自愿登记,且没有严格的约束,因此,有些格式虽有登记但不见应用,有些格式登记信息残缺不全。(2)全球数字格式注册(GDFR,GlobalDigitalFormatRegistry)。因为MIMEMTR没有提供足够的格式属性表示信息。美国哈佛大学牵头建立了全球化数字格式登记系统,美国国家档案文件管理署是这一系统的主动参加者。DGFR依据OAIS信息模型,定义了格式表征信息的4方面属性:通常属性,如格式标识符;特征属性,描述格式语

10、法和语义;操作属性,描述已登记格式输入输出的系统和服务;管理属性,描述登记本身的主要管理事项。(3)英国国家档案馆数字信息长久保留项目(PRONOM)。PRONOM提供一个文件格式数据库,搜集统计了大量的文件格式信息,以支持对格式属性和软件产品的检索。英国国家档案馆还专门开发了用于格式分析的工具DROID(DigitalRecordObjectIdentification,数字文件对象识别软件),供无偿下载使用,见图3。(4)统一数字格式注册(UDFR,UnifiedDigitalFormatRegistry)。因为GDFR和PRONOM的各自为政,暴露了相对不足,相关国家IT和档案领域教授认

11、识到,有必须建立一个统一的数字格式注册系统,2021年4月UDFR项目正式成立。这一系统是融合GDFR和PRONOM二者优点的联合项目,依据其公开的计划和路线图,到2021年7月将正式开发完成并布署使用。四、制订开放的格式标准假如把遴选并限定接收电子文件格式比方为“矮子里面拔将军”,格式分析和注册则等同于“上户口”,格式转换无异于上演“变色龙”游戏。限定接收格式和格式分析和注册的特点是被动式跟进,格式转换的特点是适应环境变迁、以变制变,上述方法表现了档案界对日新月异的信息技术发展的适应力,但没有借此获取电子文件管理的主导权。为争取主动,以不变应万变,多年来,IT企业、档案界和相关数字资源管理领

12、域的教授们祭出了第四招:制订开放的电子文件格式标准。在办公文档领域,成立于1993年,有100多个国家代表参加的结构化信息标准促进组织OAsIS(OrganizationfortheAdvancementofStructuredInformationStandards)制订了基于xML的开放文档格式ODF(OpenDocumentFormat),关键用来对可xx的办公文档进行格式排版和存放,ODF于2021年5月成为国际标准,编号ISOIEc26300。微软迫于ODF的压力,赶出了一个基于XML的文档标准OOXML(OfficeOpenXML,简称OOXML,是基于XML的种Microsoft

13、Office环境下的数据存放结构),并提交给ISO“快速通道”审批,成为另一个国际标准,编号ISOIEC29500。(中国)国家电子政务总体组所属的汉字办公软件基础标准工作组组织制订了适合中国国情的、基于XML的开放文档格式UOF(UnifiedOfficedocumentFormat,汉字简称“标文通”,即汉字办公软件文档格式规范,)并已成为国家标准,于2021年正式推广,在存档格式标准和产品研发方面,Adobe率先公开PDF格式,并取得ISO的支持,在主导版式文档产品标准和商业化运作方面拔得头筹,PDFA被国际标准化组织接纳为国际标准,编号ISO19005,今后,很多国家的档案机构认可PD

14、FAJ为电子文件的长久保留格式。微软从2021年开始推出XPS(XMLPaperSpecification,是一个电子文件格式,使用者不需拥有制造该文件的软件就能够浏览或打印该文件),并在Office2021、Vista、IE7等产品中加以支持,有望对PDF格式组成挑战。为维护国家信息安全,争取电子文件管理的主导权,经全国档案工作标准化技术委员会同意,安徽省档案局牵头制订了开放的版式文件存档格式标准版式电子文件长久保留格式需求(DAT472021),系统地界定了电子文件长久保留必需满足的11个方面格式需求。在工信部和国家档案局的指导下,北大方正、北京书生等多家著名企业和档案机构提议成立了版式技术产业应用联盟,并开发了拥有自主知识产权的版式文档软件产品。日前,工业和信息化部公布通知,将“版式文档标准制订和软件产品研发及产业化”列入了“核高基”国家科技重大专题20lO年课题。中国档案工作者和IT企业强强联合,站在新的制高点上,制订了世界上第一个和软件厂商无关的开放的符合长久保留需求的电子文件格式标准,这必将为破解电子文件格式困局这一世界性难题做出历史性贡献。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号