馆藏文献数字化的原则与方法(下)3

上传人:ldj****22 文档编号:45920172 上传时间:2018-06-20 格式:PDF 页数:4 大小:79.18KB
返回 下载 相关 举报
馆藏文献数字化的原则与方法(下)3_第1页
第1页 / 共4页
馆藏文献数字化的原则与方法(下)3_第2页
第2页 / 共4页
馆藏文献数字化的原则与方法(下)3_第3页
第3页 / 共4页
馆藏文献数字化的原则与方法(下)3_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《馆藏文献数字化的原则与方法(下)3》由会员分享,可在线阅读,更多相关《馆藏文献数字化的原则与方法(下)3(4页珍藏版)》请在金锄头文库上搜索。

1、 刘家真馆藏文献数字化的原则与方法(下) 3摘 要 文献数字化对象的选择,主要应考虑文献价值、 用户需求、 文献形体状况、 技术可行性及版权等因素。文献数字化转换技术的选择原则主要有:利于保护原件原则,满足用户需求原则,不同目的采用不同技术要求的原则,高仿真度原则,实行标准化和采用最优化方法原则,利于归档和长期保存原则,等等。对转格式、 方式,以及采用光盘还是网络版,都要作出合理考虑。全信息采集是一种优秀的数字信息采集策略。数字化信息资源应予良好的维护。表1。参考文献11。关键词 馆藏文献数字化 选择原则 转换技术 全信息采集分类号 G250176ABSTRACT For the select

2、ion of the objects of document digitization , the main things we shouldconsider include document values , user needs , physical attributes , technological feasibility and copy2right. For the selection of conversion technologies , we have several principles. Besides , we should alsoconsider formats a

3、nd media. The author thinks that full information acquisition is an excellent strategyfor digital information acquisition. 1 tab. 11 refs.KEY WORDS Digitization of library collections. Choice principles. Conversion technology. In2formation acquisitions.CLASS NUMBER G2501761 数字化对象的选择 不同类型的数字化工程,拟数字化的

4、对象有所 不同。在选择文献数字化对象时,主要应考虑文献 价值、 用户需求、 文献形体状况、 技术的可行性与版 权等因素。111 文献价值 只有具有持久价值的文献,转换后才有可能为 用户长期使用,才有可能使其投资与其效益相符。 文献是否具有持久价值是依人的主观判断的,主观 判断又是可以随人与时间而改变的,因而文献价值 的判断就十分令人棘手。 文献当前利用率的高低可否作为判断文献持久 价值的客观因素呢?这个问题极为复杂。使用频繁 的、 当前利用率极高的文献,有的并不一定具有持久 价值。例如,某些在当时、 当地极令人感兴趣的新 闻,一时存取率很高,但其使用价值可能是有限的。 而利用率当前较低,也不一

5、定意谓着该文献价值就 低或今后仍然利用率低。有时很有价值的资料并非 令许多人都感兴趣,例如,四书五经。又如,有价值的文献所处的位置太远、 交通不方便也会造成利用 率低下,或因其检索工具差也会造成文献不为人知 而利用率低下。当这类文献数字化后以超越时空方 式传送,形成新的用户群,则利用率就可能不再低 了。因而,传统环境中文献利用率的大小只能作为 判断文献价值的参考因素。为克服文献价值判断的 主观性、 局限性(仅由馆员决定) ,有必要在确定数字 化对象前进行广泛的用户调研。112 用户需求 使用频率高、 用户需求大的文献应优先考虑数 字化。这类文献的数字化,不仅有利于对原件的维 护,也为用户的存取

6、提供了便利,是受用户欢迎的。113 文献形体状况 形体损坏或字迹模糊不清的馆藏应优先考虑数 字化,以抢救文献的信息内容、 避免信息在不稳定媒 体上进一步地丢失,也有利于用户存取这类文献。114 技术的可行性 不同物理形式或不同特征的原件,例如装订资 料、 散页资料、 照片、 底片、 彩色或黑白文献等,模数 转换技术对其信息转移的支持程度不同,有些暂无法3 本文为武汉大学重大科研项目研究论文。 54中国图书馆学报(双月刊)2001年第6期ZHONGGUO TUSHUGUANXUEBAO达到满意的转换效果,也不宜数字化。数字化硬件、 软件发展很快,价格也在不断调整。有时推迟对这 类文献的数字化项目

7、,以便等待技术发展到可以完 好地解决这些问题时再去转换它更明智。例如,大 辐面的地图数字化,若用相当高的解像力进行扫描, 形成的数据如果超越了图书馆的计算机与网络的容 量,则传送的效果必然不理想。等待宽带的发展与 更大功率计算机出现,再去进行这类文献的转换,可 能更恰当、 更现实。115 版权考虑 版权是制约文献选择的另一个问题。如果拟数 字化对象受版权保护,要得到版权所有者允许后方 可以数字化;如果受版权保护的文献未得到版权所 有者许可,即使满足拟数字化对象的其他所有要求, 也不可以数字化。数字化工程负责人必须对版权有 充分的了解。IFLA网站的 “版权与知识产权” 专栏 上,有大量关于版权

8、的讨论,包括有关论文、 报告、 白 皮书、 某些国家版权机构的有关信息以及有关知识 产权的讨论等,可供我们参考。2 转换技术的选择原则211 利于保护原件的原则 目前,数字文献是不能被看成可以永久保存信 息的。为防止数据丢失后文献的再次转换,必须保 护好原件。在数字化过程中,应仔细地、 慎重地操作 原件,以免损伤原件。对于形体状况较好,无损伤的 原件,在数字化过程中应尽量减少直接操作,以免损 伤。例如扫描仪与数字相机都具有模数转换能力, 但扫描仪对纸张具有直接压力,对易脆的纸质文献 极不安全,使用数码相机更可取。这就是转换技术 选择中的利于保护原件的原则。212 满足用户需求原则 使用什么硬件

9、来转换传统文献,还必须遵守满 足需求原则。例如,对于文献价值而言,如果彩色信 息极为重要时,就不宜使用黑白扫描仪处理,以保证 满足用户需求。值得注意的是,使用什么转换设备 除应考虑用户需要外,还必须考虑经费问题,因为数 字化设备是昂贵的。213 不同目的采用不同技术要求的原则 模数转换可以达到两种不同效果,一是转换成 的数字拷贝将作为原件;二是数字化拷贝仅仅是作 为原件的代用品,提供用户利用。对于前者,如脆化 书刊数字化的目的就是使数字拷贝代替原件使用,这时的数字拷贝实际就成为了该文献的源文献。这 类文献的数字化要求极高,应将原件中全部关键信 息转换至满意的效果,以满足研究、 法律与财政的所

10、有要求。如果转换只需达到作为原件代用品的效 果,则只需有效地采集原件信息内容,使数字拷贝比 原件能更及时、 方便地提供存取即可。214 高仿真度原则 转换技术应使生成的拷贝对原件有较高的保真 度。这需要在转换中仔细地关注文献的重要细节, 以免丢失。为了使数字拷贝尽量地再现原件,除非 弥补设备的缺陷,一般不宜对图像进行处理,图像增 强不应过分,而应寻求使数字化后的文献达到准确 的复制效果即可,不能造成原始信息的丢失。215 实行标准化和最优方法原则 数字化信息在进行技术平台转换中,标准格式 很少出问题;标准能推进与简化部门间的合作。但 标准也存在一定问题,例如技术发展太快,使得花费 多年认可的标

11、准,不可避免地落后于技术发展。此 外,商业化竞争促进了专利工具的开发,使标准难以 实现。在当今这样一个高度分布与可变化的环境 中,十分完整地实现标准化是理想化的。为了适应 以上情况,人们越来越寻求建立最优方法解决这些 问题。为了保证数字化后的主文件将来可以广泛使 用,为了便于数字拷贝的管理与利用,像缩微胶片的 制作一样,模数转换必须符合标准。在不存在标准 的地方,如元数据保存、 持久稳定标识符号领域,应 采用最优方法。216 利于数字文献的归档与长期保存原则 数字技术变化太快,硬件、 软件很快就淘汰,只 有在数字化处理过程中充分地注意这一问题,才可 能有利于数字信息的长期保存与存取。数字文献归

12、 档在图书馆是一个较新的领域,但极为重要,特别是 学术研究图书馆。许多图书馆在数字化处理过程 中,不注重数字归档的技术处理,而依赖计算服务中 心,后患无穷。当前,英国许多机构已经在研究这一 问题,如大学研究图书馆联盟(CURL)承担了数字文 献归档的研究任务,对CD2ROM、 网址、 动态email列 表或其他数字资源的归档进行了研究,确定了各种 资源在数字图书馆中的归档模式。 与数字化文献长期保存及归档有关的另一个问 题是,文献数字化处理过程中应慎用压缩技术。文 件压缩可以充分地减少文件大小,便于文件的传送、 存取及拷贝,但压缩程度越大,数据丢失风险越高。64第27卷第136期Vol. 27

13、. No. 136中 国 图 书 馆 学 报THE JOURNAL OF THE LIBRARY SCIENCE IN CHINA2001年11月Nov , 2001因此,对于数字文献的归档存储不提倡压缩。除非 对于非常大的文件,如数字视频,方可考虑使用压缩 格式,以利于传送或存贮。3 转换格式与方式的选择311 格式要求 馆藏文献的数字化处理中,有多种可供考虑的 格式,如word、TIFF、J IPEG、GIF、PDG等,这些格式 各有其特点。文件格式发展很快,但淘汰也很快。 回溯文献的数字化处理的费用是相当高的,我们期 望它们能有长期效用,因而在格式的选择上首先考 虑的问题是这种格式是否有

14、利于数字文献的长期存 取。标准化格式能使数字文献在不同技术平台上迁 移的风险减至最小,并可缩小数字文献保存的风险 与费用。此外,使用被广泛采纳的格式,也可以最大 限度地减少文献长期存取的风险,因为业界会为该 格式提供迁移路径或反向兼容,以有利于技术平台 的转换。但应当指出的是,反向兼容只能维持上一 代或两代的版本兼容,对更早的版本是无兼容能力 的。因而,馆藏文献数字化格式的确定,最好采用标 准格式或采用广泛使用的格式。 为了兼顾利用与保存,欧洲国家一些图书馆、 档 案馆针对数字格式是否有利于长期保存,将格式分 成三个层次:可以接受的格式、 最优格式与不可接受 格式。鉴于保存与利用的不同要求,将

15、存档格式与 提供给用户使用的格式分开,同一文献用不同格式 提供利用与保存。如TIFF主文件可用于存储高解 像力的数字图像,可作为归档存储格式;而小容量的 文件可用JPEC格式(存取格式)用于网络传输的分 发。然而JPGE图像由于涉及到难以避免的数据损 失,不可用于存储。转换格式的选择可参考以下选 用原则:(1)无论是存储格式还是存取格式,均应使 用非专利化格式; (2)有选择的使用完善的、 已广泛 使用的、 市场上的 “事实标准” 格式; (3)尽可能将归 档存储格式、 对用户传递格式区分开来并区别使用;(4)尽量减小使用格式的种类,以简化管理过程与降低管理费用; (5)对归档存储的文件,尽量

16、不要加密 或压缩。312 转换方式考虑 数字化最简单的途径是使用扫描或数码相机形 成原始文献的数字图像文件,其中用扫描仪是最经 济的。 另一种转换方式是将文献转换成文本,以文本方式存贮文献内容。这种转换方式有直接键入法与 格式转换法。直接键入方式可以形成ASC 数字化 文本文件,ASC文本很适于使用关键字或短语检 索。对某些数字化工程而言,回溯文献数字化的目 的就是为了便于检索。当数字文件可以用字、 词进 行检索时,目录、 字典与索引就会特别便于使用,数 字文本很易于其他用户共享、 共操作。但用键入方 法形成的数字文本难以复制原始文献的结构与版 式,如果没有专门代码,用户难以直接查到某章某节 的内容。 也可以将扫描形成的图像文件,经OCR软件处 理形成文本。经OCR软件处理形成的文本,可产生 便于检索的索引,实现全文自动检索。此外,还可用HTML语言将OCR形成的文本编辑上网,进行全文 检索。但其缺点是OCR只能较好地识别印刷体,并 不能识别所有其他字体,对于文字极为复杂的中文, 识别力有限

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号