数字文档保护技术研究

上传人:宝路 文档编号:18006765 上传时间:2017-11-13 格式:DOC 页数:5 大小:79.49KB
返回 下载 相关 举报
数字文档保护技术研究_第1页
第1页 / 共5页
数字文档保护技术研究_第2页
第2页 / 共5页
数字文档保护技术研究_第3页
第3页 / 共5页
数字文档保护技术研究_第4页
第4页 / 共5页
数字文档保护技术研究_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《数字文档保护技术研究》由会员分享,可在线阅读,更多相关《数字文档保护技术研究(5页珍藏版)》请在金锄头文库上搜索。

1、数字文档保护技术研究无论是在大型的数字图书馆项目还是小型的专题数据库建设过程中,图书馆都需要妥善管理各种类型的数字资源,包括图片、文档、视频等,其中,数字文档是最常见的数字资源之一。按照文档格式的差异,数字文档可分为DOC、 PDF、TXT 、CHM 等格式文档。其中,PDF 文档以其跨平台通用、数据内容多样、稳定安全的优点,成为主流的数字文档格式。有鉴于此,本研究以PDF 文档为操作对象,从保护数据隐秘性、文档权限可控性、文档责任者身份可辨性以及文档内容准确性的角度出发,探讨数字文档数据加密、文档操作权限保护以及文档身份认证的操作思路,并提出可行的技术实施方案。1. 图书馆数字文档保护的内容

2、谈及数字文档保护,最广为人知的就是数字版权保护技术DRM,它被广泛应用于数字出版领域,包括数字音乐产业、电子书产业等,通过对数字文档嵌入认证访问控制技术,限制数字文档的传播和利用方式,从而达到降低数字文档在未被授权的情况下被非法利用的可能性。DRM 不仅保护了数字产品的版权管理,而且还保护着传统出版业以版权控制为基础的盈利模式在数字出版时代的延续。虽然,由于 DRM 阻碍了数字出版物的自由利用在近年遭到抵制(如数字音乐出版业的“放弃 DRM”运动) ,但是,整个数字出版业的大环境仍未有根本改变,以版权保护为根基的出版、发行、盈利模式仍是主流,新的数字出版运作模式只是在探索中,但未能成为常态模式

3、。保存和传递文献信息是图书馆的传统使命,在数字时代,如何促进数字出版业的茁壮发展,推动新型的数字文档传播利用机制的形成,是图书馆理所应当的责任。为此,在涉及数字版权保护的问题上,图书馆应从保证数字文档的可获取性的角度来考虑,在版权所有者赞许的基础上,避免使用严格的数字版权保护技术,而选用适当宽松的数字文档操作权限保护技术作为优先策略。数字文档的可获取性是数字文档保护的大前提。如果不以可获取性为目的,那么,数字文档根本没有保护的的意义和必要。只有以致用为目的,才需要采取各种保护策略,促进数字文档更好地被传播和利用。换言之,数字文档保护是以促进文档的利用为目的的,这与 DRM 有很大的区别。DRM

4、 从保护数字文档的盈利性为出发点,进行严格的使用限制。而数字文档保护是以保护文档可获取性为出发点,把促进用户更好地利用数字文档放在首位,为此,它是从保护数字文档的权限属性和使用属性的角度考虑,制定相应的技术策略,保证数字文档从作者到用户的传递和利用过程得以顺利进行。数字文档保护策略需要兼顾文档权限属性和文档使用属性。文档权限属性是指数字文档的权限所有者对文档操作的控制权限。包括内容保密控制、内容传播控制、内容提取控制、内容加工控制等。文档使用属性是指数字文档用户对文档的使用要求,包括文档可获取性要求、文档可操作性要求、内容准确性要求、文档责任人身份可辨性要求。虽然权限属性和使用属性分属文档作者

5、和文档用户的权力诉求,两者之间必然存在矛盾与对立,但是,两者均统一存在于数字文档中,必须服从于数字文档的存在价值传播和利用,因此,数字文档的权限属性和使用属性需要保持均衡状态。从这个意义上讲,数字文档保护的意义在于主张文档权限属性和使用属性的过程中,取得两者之间的均衡,从而保护数字文档的顺利传播和利用。据此实施的数字文档保护策略包括三方面的内容:(1)保护数字文档的内容隐秘性。对于包含机密信息或者只供授权人员使用的数字文档,需要对文档内容进行加密控制以防内容泄露。使用者打开文档前必须提供授权信息,文档据此进行正确解密后,方可使用。(2)保护数字文档的权限可控性。为充分尊重数字文档的所有者,保护

6、所有者对文档权限控制的主张,图书馆需要向数字文档所有者提供文档内容保密控制、内容传播控制、内容提取控制、内容加工控制等操作的授权选择。只有充分尊重所有者的文档主张权利,提供灵活可行的授权方案,才能鼓励数字文档的所有者提供授权文档。(3)保护数字文档内容的准确性。无论对于图书馆还是使用者,他们都需要保证数字文档的内容是忠于作者原意,没有经过更改的。图书馆的惯常做法是遵循“文责自负”的原则,在数字文档的正文前附上带有文档责任者签名的声明文书。对于文档使用者而言,验证文档内容的准确性更为重要,仅凭一纸声明文书显然不能完美地解决问题。使用者需要一种能够准确地辨认文档内容是否出自作者之手的可行方案。准确

7、性是保证文档可用性的必要条件。在传统出版领域,出版发行机构肩负起文档内容准确性的保护工作,出版内容基本是准确且忠于作者原意的。在网络虚假信息大量充斥的环境下,对于数字文档内容准确性、可辨性的要求是一种理性的回归。作为一个文化和学术机构,图书馆需要审慎地对待数字文档的准确性问题,采取合理的技术手段制定保护数字文档内容的准确性。这不仅是对数字文档使用者的负责,而且是对数字文档出版发行的未来负责。2. 图书馆数字文档的保护技术方案本节探讨的所有技术方案均以 PDF 文档为操作对象,应用到的技术包括PDF 文档加密技术、PDF 文档封装技术、数字签名技术、数字证书技术。为了实现对 PDF 文档的相关操

8、作,笔者引用了 PDF 文档的应用程序接口软件包iTextSharp,以实现应用程序对 PDF 文档对象的调用与操控。2.1 PDF 文档的安全管理机制为保护文档的真实性、完整性和机密性,PDF 文档拥有口令加密和数字签名两种安全保护模式,这两种保护模式可单独或组合应用于不同的文档。一旦设定了安全保护,PDF 文档即可持久地保持其文档安全性。图 1 描绘了 PDF 文档的安全管理流程。带安全设置的文档内容复制权限内容提取权限内容打印权限内容编辑权限口令加密数字签名带数字身份证书的文档验证用户身份合法性验证文档内容合法性验证作者身份合法性带口令保护的文档1.权限设置 2.安全保护 3.文档验证图

9、 1:PDF 文档安全保护机制流程图PDF 文档安全管理流程包括权限设置、安全保护和文档验证三个阶段。在第一阶段,按照文档所有者对文档权限属性的主张,设置相应的文档使用权限。但是,此时的文档还处于非加密状态。于是,需要进行第二阶段操作,对文档加密保护,以防止文档的内容和权限设置遭到非法篡改。经过加密控制的文档才具有真正安全性。但是,经过加密保护的文档如何面向使用?使用者又如何验证文档的安全性?文档在加密的同时提供了解密的算法,只有经过授权用户提供解密凭证(口令或证书)解密文档后才能打开文档,从而验证了用户身份的合法性。具有合法身份的使用者,可通过文档附带的数字身份证书,验证文档内容是否经过他人

10、篡改,以及验证文档作者的身份是否真实。文档安全管理机制的意义在于,在文档的所有者和文档的使用者之间架起了一条安全通道,为数字文档从作者到用户提供了一个有序的、可控的、安全的过程,符合双方的意愿和利益,为图书馆合理有序地发布、传播、使用数字文档提供了保障机制。2.2 PDF 文档的口令加密技术方案口令加密是指使用指定密码为加/解密凭证的加密技术。按照作用的不同,加密口令分为用户口令和权限口令两种。用户口令用于保护文档的合法使用,即只有提供正确的用户口令方可打开文档。权限口令用于保护文档的安全属性,即只有提供正确的所有者口令方可修改文档的安全设置。PDF 文档的口令设置方式分为三种:只设用户口令、

11、只设权限口令,以及两者都设置。无论哪种口令设置方式,PDF 文档的加密过程大致相同。首先根据口令信息计算出加密密钥,然后再采用 AES 算法加密 PDF 文档。经过加密后,PDF文档的交叉引用表增加了一个加密字典对象,里面包括 11 项内容信息,供解密时验证口令和解密文档使用。PDF 文档解密过程如图 2 所示。在口令解密机制中,不设置用户口令的文档可直接根据加密字典的内容计算解密密钥,这意味着文档失去了安全保护,存在被恶意使用的可能。这取决于文档使用软件是否按照 PDF 文档的安全机制。如果应用软件完全遵循 PDF 文档规范,那么,关于文档安全设置的加密信息依然生效,只有提供正确的权限口令才

12、能更改文档安全设置。但是,如果用户所用的 PDF 应用软件不遵循 PDF 文档规范,无视文档的安全设置限制,那么,PDF 文档的所有权限将被完全开放。有鉴于此,提供用户口令和权限口令双重保护是必须的。在安全系数高的用户口令保护下,PDF 文档只存在理论上被破解的可能,能够有效防止止非法用户的恶意破解行为。否是用户口令权限口令加密文档计算密钥解密文档按照权限设定限制文档操作解密文档并开放所有操作权限是否为空校验口令图 2:PDF 文档口令解密过程Acrabat 专业软件可实现 PDF 文档的口令加密操作,但是,图书馆需要处理批量的 PDF 文档,软件操作显得耗费人力和低效。为此,笔者引用了iTe

13、xtSharp 的 PdfStamper 类,辅助实现批量处理 PDF 文档的加密业务。程序核心代码如下:PdfReader pdfReader = new PdfReader(“源文件路径”); /创建 PdfReader 读取源 PDF 文档FileStream stream = new FileStream(“目标文件路径”, FileMode.Create); /创建文件流写入新 PDF 文档PdfStamper pdfStamper = new PdfStamper(pdfReader, stream); /创建 PdfStamper 对象pdfStamper.SetEncrypti

14、on(PdfWriter.STRENGTH128BITS, “用户密码”, “权限密码”, “permissions”);/调用文档加密方法 SetEncryption,其中第一个参数表示采用 128 位密钥加密;第二三个参数分别是用户口令和权限口令,空口令用 Null;第四个参数表示文档操作权限值。程序运行后,PdfStamper 类将调用 SetEncryption 方法,创建一个经过加密的源文档副本。程序中带引号的内容均是需要设置参数,按照实际加密情况配置。其中,SetEncryption 方法的 permissions 参数包括 8 个权限值,对应着 PDF文档的 8 项安全属性。其对

15、应关系如表 1 所示。指定具体的 permissions 参数值,表示开放对应的文档操作权限。开放多个操作权限,则使用“|”符号间隔参数值。如需禁止所有文档操作权限,可将 permissions 参数设置为 0。表 1:PDF 文档操作权限的参数设置说明permissions 参数值 对应的操作权限PdfWriter.AllowPrinting 允许打印PdfWriter.AllowModifyContents 允许修改内容PdfWriter.AllowCopy 允许拷贝PdfWriter.AllowModifyAnnotations 允许修改注释PdfWriter.AllowFillIn 允

16、许填充表单PdfWriter.AllowScreenReaders 允许提取内容PdfWriter.AllowAssembly 允许文档组合PdfWriter.AllowDegradedPrinting 允许低清晰度打印上述方案解决了第三方程序调用 PDF 文档核心类自动完成加密控制流程的操作问题。在此基础上,程序增加循环控制流程可实现对批量 PDF 文档的加密业务。程序完成后,如果需要被其他系统随时调用,可以采取应用程序的形式发布。如果需要定时处理执行业务,则可以采用系统服务的形式发布。2.3 PDF 文档的数字签名技术方案只有内容准确的文档才是可用的文档,从这个意义上讲,PDF 文档需要为用户提供内容准确性的验证途径,帮助用户判断文档内容是否经过增删添改,文档内容是否经过文档作者的确认。为此,笔者引入在信息安全通信已广泛使用的数字签名技术,构建 PDF 文档内容准确性验证方案。数字签名并非笔迹签名的扫描图像,而是一种不对称加密算法的典型应用。其实现过程如图 3 所示。文档内容先经过散列算法加密产生数字摘要,然后再使用文档作者的私钥对

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号