文献影像数字化及网络应用的若干问题

上传人:E**** 文档编号:118232689 上传时间:2019-12-11 格式:PDF 页数:13 大小:572.94KB
返回 下载 相关 举报
文献影像数字化及网络应用的若干问题_第1页
第1页 / 共13页
文献影像数字化及网络应用的若干问题_第2页
第2页 / 共13页
文献影像数字化及网络应用的若干问题_第3页
第3页 / 共13页
文献影像数字化及网络应用的若干问题_第4页
第4页 / 共13页
文献影像数字化及网络应用的若干问题_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《文献影像数字化及网络应用的若干问题》由会员分享,可在线阅读,更多相关《文献影像数字化及网络应用的若干问题(13页珍藏版)》请在金锄头文库上搜索。

1、文献影像数字化及网络应用的若干问题 邱晓威 新技术使得对文献影像使用的方法和目的也变得复杂起来。在带来方便的 同时,也带来新的问题。如对文献信息的真实、完整和可靠等方面带来的种种 威胁,以及通过网络传播时带来更多的知识产权保护等法律方面的问题。本文 即以文献影像新技术发展应用涉及的问题为对象,进行分析,提出一些对策。 本文讨论的文献是指平面载体的信息记录( 如树皮、锦帛、纸张、胶片 等载体上记录的图形、符号等) 。文献影像则是指以平面上分布的像素方式记 录的文献内容。 按照人们对文献的处理程度不同,可以把文献划分为各种级别: 零次文献。主要包括两个方面的内容:一是制作文献的想法、计划等;二 是

2、未公开于社会即未经正式发表的原始的文献,如书信、手稿、草图、记录、 笔记和其他一些内部使用的非正式资料。其法律地位尚不确定。但其常作为一 次文献法律地位( 凭证、知识产权等) 认定的基础。 一次文献。这是人们的生产、科研、社会活动等实践生产出来的文献。如 公文、图纸、档案、书刊、专利、科技报告、会议记录、论文,还包括手机短 信、网络博客作品等。 二次文献。是将大量的一次文献进行整理、浓缩、提炼,按照一定的逻辑 顺序和科学体系加以编排存储的文献。如汇编、目录、索引、摘要、数据库 等。二次文献具有明显的汇集性、系统性和可检索性。其重要性在于提高一次 文献的使用效率和质量。 三次文献。是选用一次文献

3、,经过综合、分析、提炼而编写出来的文献。 如综述、评论等,还包括知识库系统中对某些特定问题给出的分析、判定和解 决方案,如档案知识库系统对历史事件的解释或综合说明,疾病自动诊断系统 所给出的结果等。 传统文献影像技术主要是应用于一次文献。其目的是缩小保存空间或通过 向耐久性载体的转移延长文献信息的保存时间。如缩微胶片技术可将纸质文献 - 1 3 1 文献影像技术的发展与应用 的体积缩小数百倍,保存时间延长数倍。 随着数字化和网络化的发展,在信息技术的支持下,文献影像技术已经覆 盖了文献的多次级别。例如使用O C R 技术已经可以把文字影像自动识别转换 成可编辑的文字,从而使其存储的信息应用方式

4、更灵活,应用范围更广。 可以说新技术使对文献影像使用的方法和目的也变得复杂起来。在带来方 便的同时,也带来新的问题。如对文献信息的真实、完整和可靠等方面带来的 种种威胁,以及通过网络传播时带来更多的知识产权保护等法律方面的问题。 本文即以文献影像新技术发展应用涉及的问题为对象,进行分析,提出一些对策。 可以从下面的对比中了解到文献影像技术的发展。 传统文献影像技术:从纸质文献复制成缩微胶片或复印件,然后生成文献 复制品库。 新型文献影像技术:从文献( 包括纸质文件或电子文件 经数字化加工 或数据处理技术生成文献影像数据库。还可以通过自动识别技术( o c R ) 或 自动索引技术,进一步生成文

5、献内容数据库( 包括文本或矢量图) ,并进一步 产生文献索引及全文检索库,经智能化加工生成更高级的知识库。对原生类电 子文件,还可以通过数字化C O M 输出技术设备将电子文件制作成缩微胶片等 硬拷贝。 可以说新文献影像技术的主要应用体现在两个方面:一是支持信息化的资 源库建设,二是转换成硬拷贝载体后可更长久保存并取得确定的法律地位。 一、文献影像技术介绍 以缩微摄影( 胶片) 为基础的文献影像技术应用已经有近一个世纪了。 今天我们讨论的文献影像技术是在新的技术环境下进行的,所以很多认识不可 避免地会以信息化或数字化的技术为基础。 文献影像技术可以理解为是对文献进行采集、复制、传输或载体转换处

6、理 的技术。这里的文献主要是指记录于平面( 二维) 载体上的符号等信息形式 ( 文字、图形等) 。 从以下几方面可以对文献影像进行分类: ( 1 ) 从信息模式上划分 模拟型文献影像,如文献的缩微品( 胶片) 、复印品( 纸张) 等; 数字型文献影像,如计算机和信息网络环境中的数字影像文献,如数码照 片、扫描图形、矢量图、电子表格等; 1 3 2 文献影像数字化及网络应用的若干问题 ( 2 ) 从文献影像生成或转换角度划分 模一数转换型:例如通过对普通纸质文献经扫描获得的扫描图形( 光栅 图,或称位图) ,或者由胶片扫描转换的影像文献; 数一模转换型:例如计算机内的数字影像或原生电子文件经数字

7、打印胶片 设备制作成缩微胶片等; 原生型:由计算机直接产生的电子公文、C A D 计算机辅助设计图、固化 文本( 版式) 电子文件等; ( 3 ) 从数字化媒体形式分 有光栅图、数码照片、显示屏拷贝、矢量、三维、图形更迭动画、矢量图 动画、固化文本、版式文件等 二、影像类文献是信息资源建设的重要组成部分 文献影像是信息的一种常见形态,而且是国家信息资源的重要组成部分。 而文献影像技术则在信息资源建设中发挥着重要作用。例如,文献影像技 术可为落实我国档案事业发展“十一五”规划提出的一系列目标提供重要的 技术支持。“十一五”规划的总体目标是建设较大规模的全国性、系统性、分 布式、规范化的档案信息资

8、源库群,建立一批电子文件中心和数字档案馆,实 现档案信息资源社会共享;档案信息化建设的任务是加大档案信息资源管理力 度,全面整合各类档案信息资源,促进档案信息资源总量增加,质量提高,结 构优化;加强多形式多层次共享平台建设,推进服务机制创新,促进档案信息 资源的公开、共享和再利用,全面提升档案信息资源开发利用水平和能力;加 快优化档案信息资源开发利用工作的保障环境,建立长效发展机制。 规划要求根据“统一领导、标准先行、利用优先、分步实施”的原则, 有序推进传统载体档案数字化进程。充分利用信息化手段,对31 2 7 个国家综 合档案馆保存的档案进行数字化加工和数据资源整合。预计仅国家综合档案馆

9、中需数字化的公文类档案文献数量就有大约2 1 亿卷( 件) ,约3 0 亿页,除 去必须保密或控制利用的很少一部分,可以向社会开放的约有2 亿卷( 件) , 目前已经数字化的数量不足1 0 。由此可见文献影像数字化加工的任务还是 相当艰巨的。 为达到信息资源建设和整合的要求,需要制定统一标准,规范档案数字化 与网络化建设,按照共建共享、互联互通的要求,建立与完善国家档案信息目 录数据库、纸质档案全文数据库和多媒体档案数据库等各类档案数据库。优先 1 3 3 文献影像技术的发展与应用 抓紧建设目录和元数据库,以及有迫切需求和明显效益的专题档案的数字化和 社会化服务工程。规范电子文件归档、管理与接

10、收工作,建立健全电子档案接 收机制和相关规章制度。利用电子政务网络平台进行政府公开信息的网上数据 传输、采集和档案发布。在条件具备的中央、国家机关和地方建设电子文件中 心和数字档案馆。加强档案信息利用与社会服务,加强档案网站建设,充分利 用互联网,开办档案信息查询利用窗口,提供档案网上公布和检索利用,主动 提供公益性信息服务,满足各方面利用档案信息的需求,实现档案信息的社会 共享。 三、文献【影像) 数字化技术规范及数字化工程 1 按照标准D A T3 1 2 0 0 5 纸质档案数字化技术规范、照片档案数 字化规范的要求进行如下工作:文献影像采集( 扫描、拍照、电子文献固 化处理等) ; 文

11、献整理; 文献影像采集( 扫描、拍照、电子文献固化处理等) ; 影像质量管理; 文献索引制作( 著录标引、元数据处理等) ; 数据库整合( 机读目录与原文影像库的连接等) ; 制作满足归档或移交要求的通用文献信息包; 归档保存和提供利用( 设备、文献影像) ; 文献整理( 目录数据准备、装订处置、扫描件区分、页面修整、整理登 记、装订恢复) ; 目录建库( 著录标引、数据录入) ; 文献扫描( 幅面大小、分辨率、色彩、灰度等) ; 图像处理( 图像数据质量检查、纠偏、去污、图像拼接、裁边处理) ; 图像存储( 黑白二值模式一般用,1 1 F F ( C 4 ) 格式存储。灰度和彩色模式 一般采

12、用J P E G 格式。压缩率的选择应保证扫描的图像清晰可读且尽量减小存 储容量。图像文件的命名等) ; 图像一字符识别转换或位图一矢量图转换,自动标引或全文索引,构建数 据库和知识库处理; 数据质检;数据挂接( 目录数据库与图像数据库,质检合格后,汇总加 载到数据数据库,建立关联关系) ; 1 3 4 文献影像数字化及网络应用的若干问题 数据验收; 数据备份( G B T 1 8 8 9 4 电子文件归档与管理规范规定:长久保存 的电子文件应当制作成纸质或缩微胶片等硬拷贝) ; 数据整合; 制作跨平台信息包: 成果和制作过程元数据管理等。 2 文献影像的数字化应当按照工程项目进行管理实施:

13、缩微胶片制作工程,设备耗资较大。操作技术含量高,与计算机网络的连 接难度大,可委托专业公司设计承担。 文献影像的数字化工程,可依托网络和专业软件系统支持,投资不多,操 作管理技术较易掌握。可选择的专业服务公司很多。如果由公司带设备配软件 提供操作员,质量有保证、效率较高、费用较低。 3 纸质文献数字化转换加工系统及设备介绍 专业化的数字化加工系统的一般构成是:局域网支持下配置数字化加工专 用设备且由专用控制应用软件构成的信息加工流水线系统。其主要功能包括: 文献整理、著录标引、建立机读目录库、文献扫描、建立文献影像信息库、内 容信息识别、建立原文索引、建立全文检索数据库、输出文献影像缩微胶片

14、的等。 文献影像数字化使用的设备有: 高速扫描与数字化管理系统、数码复合机( 复印、打印、网络扫描) 、不 拆页扫描仪( 便携式、拍照式) 、消中缝零边距、缩微胶片扫描仪、高速胶片 打印存档机、联机光盘存档管理机等。 据了解,档案馆和图书馆的文献影像数字化加工的工作正在大规模地高速 度地进行之中。例如,北京市档案馆原来的想法是,先加工社会需求较明显, 利用率较高,较重要的档案。但是在工作却中却发现,上述判断很难与实际相 符,经常是已经建立数据库的文献影像并不”热门”,而尚未数字化的反而成 为利用热点,使得信息化手段发挥不出预想的作用。所以该馆不得不改变了策 略,认为与其猜测社会需求,不如加大投

15、入和加快速度,把可以开放的档案尽 快制作成数字化文献影像,做到与北京市的信息化整体规划和要求相吻合。 四、数字化影像的真实性保证 以前在模拟技术环境下制作的文献影像改动起来比较困难。造假成本很高 1 3 5 文献影像技术的发展与应用 且易被识破,所以保真性较好。 但是数字化文献影像依靠计算机信息处理技术,改动起来非常方便,而且 不留痕迹,所以以假乱真的情况会经常发生,再加上目前缺少法律框架和标准 约束。 实际中发现影响文献影像真实性的常见因素有如下一些: ( 1 ) 新闻报道政策或政治因素等导致改变影像内容,典型例子如台湾媒 体刊登陈水扁阅兵照片中添加飞机编队,国内出现过领导人照片头像被换等;

16、 ( 2 ) 修饰过度导致影像失真,常见的处理手段有调整色阶、饱和度、色 相、对比度、主体更换、背景更换、图像切拼、图像变形、去污等处理。较为 严重的问题是目前数码相机已经普及,记者提供照片之前已对相当一部分作过 不同程度的调整,由于目前没有完善的法规,所以调整程度失控导致文献影像 失真情况时有发生; ( 3 ) 传输、转存等操作导致信息质量下降或信息丢失; ( 4 ) 图纸版本错乱等。 为防止这类情况的发生有必要加强法规体系的建立,同时完善管理制度和 监管 五、文献影像信息在网络中的存储问题 由于文献影像信息数量多,数据类型多样,面向社会的利用面广,所以对 计算机网络中的存储管理有一些特殊要求。为了管好这些信息,有必要了解一 些典型的计算机和网络的信息存储管理方式等问题。 5 1 计算机和网络的信息存储管理方式 1 直接连接存储( D A S ) D A S ( D i r e c tA t t a c h e dS t o r a g e ) 即“直接连接存储”。在这种存储结构下, 存储设

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号