中国科学院联合机构仓储系统的开发与建设

上传人:ss****gk 文档编号:208879214 上传时间:2021-11-08 格式:DOC 页数:15 大小:60.05KB
返回 下载 相关 举报
中国科学院联合机构仓储系统的开发与建设_第1页
第1页 / 共15页
中国科学院联合机构仓储系统的开发与建设_第2页
第2页 / 共15页
中国科学院联合机构仓储系统的开发与建设_第3页
第3页 / 共15页
中国科学院联合机构仓储系统的开发与建设_第4页
第4页 / 共15页
中国科学院联合机构仓储系统的开发与建设_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《中国科学院联合机构仓储系统的开发与建设》由会员分享,可在线阅读,更多相关《中国科学院联合机构仓储系统的开发与建设(15页珍藏版)》请在金锄头文库上搜索。

1、中国科学院联合机构仓储系统的开发与建设摘要对中国科学院联合机构仓储系统的建设 思路和实施过程中遇到的主要问题进行讨论,包括如 何选择合适的机构进行试点和示范,以推动机构仓储 的实施;如何进行中文机构仓储软件系统的定制和扩 展开发;如何集成现有系统和组织机构仓储服务;如 何建立联合仓储系统等。关键词中国科学院国家科学图书馆机构信 息环境联合机构仓储分类号G250.731 刖目不断增长的研发投入为中国科学界带来了丰硕的 成果,在全球的科学研宄中,中国科学院的科学家们 扮演着越来越重要的角色。但是,由于书刊价格上涨 及其他方面的因素,中国科学院的研宄人员已经在国 外发表的许多高水平论文却往往不能为本

2、国的科学家 所容易地查看或者获得,如何充分利用这些高水平的 学术资源己成为当前中国科学院的科学家、政策制定者和图书馆人要面对的一个大问题。2005年,针对中 国科学院内一些代表性研宄所开展的调查显示:中国 科学院的科研机构迫切需要实现对数字资产的管理, 以便进一步提升机构的社会形象和扩大机构的学术影 响,重用已有科研成果,实现成果的长期保存。这种形势下,将中国科学院作为一个整体性的研 宄机构来规划和建设一个统一综合的机构仓储系统, 实现对全院数字科研资产的统一管理和利用,从表面 看来,应是一种比较理想的选择。但根据中国科学院 在组织结构和管理模式上的特点,这种单一性的方案 将在可行性和实效性方

3、面存在很大的疑问。中国科学 院由分布于全国各地的89个研究所组成,各研究所以 相对独立和自主的方式确定自己的研宄方向与发展目 标,开展有关的科研活动,并且都有自己的图书馆室。 因此,各研究所是全院范围内组织和开展具体科研活 动的基本单元,也应该是对科研产出进行积累和管理 的基本单元。而且,研宄所己经开始认识到对其数字 科研产出进行管理在促进其共享利用、扩大学术影响 等方面的重要意义和作用。据此,中国科学院国家科 学图书馆提出了充分利用和调动研究所的积极性,构 建全院联合机构仓储体系的构想。即:首先,以研宄 所为单元构建各所的IR系统;然后,依托分布于各研宄所的IR系统,通过元数据开放获取和内容

4、聚合的方 式,建立起全院联合的机构仓储服务体系,从而发展 和建立起:全院的知识中心,支持全院范围内数字 资产的汇集和管理;全院研宄成果有效分发、传播 和共享利用的机制与平台;对正式出版渠道的补充, 逐步形成全院整体的e-Scholarship仓储和交流平台, 全院知识产出的长期数字保存机制。目前,按照上述构想,中国科学院国家科学图书 馆已经启动了全院联合机构仓储体系的研宄和实施计 划,并取得了初步的成果。下文将对建设过程的主要 环节和涉及的主要问题进行讨论。2研究所IR系统的开发建设研究所IR的建设是整个计划实施的第一阶段,也 是最重要的基础环节,主要通过试点和示范的模式进 行开发建设。目前,

5、我们通过选择中国科学院力学研 宄所作为试点和合作单位,已经部署并建立起了该所 的IR服务示范系统。2.1试点研究所的选择选择试点研宄所的目的,一方面,是为了能够准确了解和把握研宄所对IR的建设需求;另一方面,也 希望通过在试点研宄所进行IR的部署,为其他研究所 树立榜样,发挥示范效应,从而带动和吸引其他研宄 所积极加入全院机构仓储建设体系中来。为了达到这 样的目的和效果,在试点研究所的选择过程中,我们 主要考虑了以下因素:2.1.1研究所对IR建设有较高的积极性一方面, 研宄所的管理层,特别是主管信息化工作的领导要对 IR建设的作用和意义有明确的认识,对IR的建设持欢 迎和积极的态度,已经打算

6、或愿意支持IR的规划建设。 某种程度上,这是决定是否能够启动IR规划建设的先 决条件,也是IR建设所需要的各种政策环境、设备条 件、人员等得到持续有效支持的保障。另一方面,研 宄所图书馆的领导和有关工作人员将是本所IR规划与 建设的主要执行者,因此他们是否有足够的积极性和 热情,对于IR的建设成败也有着重要的影响。2.1.2研究所能够保障IR实施的必要投入包括 研宄所是否已经具备IR实施所要求的基础软硬件环境, 或者能够保证进行投入和重新建设;是否能保证IR建 设的人员投入,特别是在计划实施的初期,应能够保 证科研管理部门的有关人员和图书馆管理者有一定的 时间和精力投入IR的规划与建设,并且能

7、够指派专职的人员,专门负责IR的具体建设实施以及其他方面的 经费投入的保证等。2.1.3研究所的信息环境有相对较为丰富的应用 IR做为研宄所整体信息环境发展和构建的重要“组件”, 要能够适应与其他相关系统进行互联互通的要求。如 果研宄所的信息环境过于简单或单一,将不利于识别、 捕获和形成一个相对完善的功能需求集合,也不便于 对IR进行实际运行和测试,并可能影响到IR应用软 件在全院范围内的通用性和适用性。2.2特殊功能和服务需求的识别从IR的发展来看,采用成熟的开源软件已经成为 一种主流的选择。因此,我们采取了基于开源软件 DSpace建立原型系统,与试点研究所进行交流和沟通, 以进一步捕获与

8、明确需求的方法。事实证明,这是一 种非常行之有效的方法。它不仅提供了一个对IR通用 功能需求和服务进行分析的基础,而且也有助于快速 地确定功能改进的需求、发现和捕获新的功能需求。按照这一过程和方法,我们发现除了通用功能和服务 外,合作研究所提出了一些新的服务需求,与新型机 构信息环境中有关IR建设的情景描述不谋而合。这些 新的或特殊的功能和服务需求包括:?IR是机构整体信息环境的一部分,需要与其他系 统有机地集成,能够从其他系统,如图书馆自动化系 统、ARP系统等数据信息系统中自动地提取有关的信 息,减少数据加工的重复和人工操作,提高系统之间 的协同工作能力和效率。?尽可能减少由科研人员以自助

9、提交方式进行内 容提交和加工描述的要求,避免使科研人员对IR产生 使用繁琐、信息描述加工量大的印象,从而降低对系 统使用的期望和使用频率。?IR应能够提供对常见格式内容的自动分析和识 别,从中抽取并形成有关的元数据描述信息,从而最 大程度地减少人工描述和加工的要求。?IR应该有灵活完善的访问控制策略,比如基于IP 地址的全文内容访问控制以及面向特定用户或用户组 的全文内容访问和存取策略等。这虽然有违于IR实践 开放存取的初衷,但确是机构的实际需求。?支持信息的多维组织、浏览、导航和检索,如基 于研宄室、内容类型、学科方向、主题、作者等的信 息组织与浏览,提供全文检索、检索结果的链接检索、 二次

10、检索、相关检索等。?IR不仅要能够与研宄所内的各相关系统之间集 成,还应该支持与外部的应用系统之间的开放集成,方便系统之间的数据交换和共享。这就要求IR必须支 持多种开放接口,如RSS内容聚合接口、OAI元数据开放获取接口、SRW/U标准检索接口、 OpenURL开放链接接口等。2.3 IR的开发建设2.3.1开发策略由于IR的建设和发展在近年来 得到了国内外特别是国外各著名大学和研宄机构的普 遍重视,支持IR构建的应用软件平台也开始逐步走向 成熟,特别是以DSpace、Eprints等为代表的开源IR 软件,基本上已经成为国际上IR建设和部署的主要技 术选择。因此,我们也采取了基于此类开源软

11、件进行 定制和扩展开发的策略。根据对一些已得到广泛应用的开源IR软件的比较 和分析,结合我院知识仓储系统建设的需求,我们认 为DSpace具有系统结构比较合理、功能较为完善、支 持任意类型的内容存储等特点,适合作为我院IR应用 软件系统定制和扩展开发的基础。2.3.2基于DSpace的IR系统功能结构总体上, 研究所IR将不仅考虑作为研究所独立运行的知识资产 管理系统,同时也将支持其作为研宄所信息基础设施 环境构建的重要组成部分,支持与其他相关信息系统 之间的关联和集成。结合前述对IR系统功能和服务需求的分析,这里 给出我院基于DSpace的IR系统的功能。其中,用户服务子系统为用户提供:多维

12、的信 息浏览和导航途径;简单检索、高级检索、全文检 索等灵活多样的信息检索方式;内容订阅与推送服 务,按照一定的条件组合,进行相关信息内容的分 析与汇总、结果的可视化展现等扩展服务。信息摄取子系统支持任何授权用户以自助提交和 存档的方式,按照一定的工作流程和内容描述要求对 提交内容进行描述和编辑,并提交到IR中。同时,也 支持以批量导入的方式将符合系统数据格式要求的内 容导入到系统中。信息存档子系统由提交的数字对象(内容)及其元 数据组成,支持对数字对象的长期保存、管理及存取 利用服务。开放接口子系统主要通过实现OAlData Provider,支持联合机构知识仓储系统实施元数据或数字对象的

13、聚合,并根据与其他应用系统集成的要求,提供 SRW/SRU、OpenURL 等服务接口。公共服务子系统提供系统运行和服务过程中的各 种公共服务与管理维护功能的支持,如分类表的管理、 元数据及内容的维护与管理、用户管理、访问统计分 析等。2.3.3主要的定制和扩展开发工作包括 DSpace的本地化以及针对特定功能需求的定制和扩 展开发。DSpace的设计具有良好的分层架构,支持基 于公共API进行功能和服务的扩展开发方式。在开发 过程中,尽管我们尽量通过对其API的调用和扩展来 进行功能的定制和开发,但在很多情况下,还是需要 对其底层代码进行修改才能完成一些特定的功能开发 需求。?DSpace的

14、本地化及界面定制。主要包括以下方_DSpace默认界面为英文界面,根据中文信息 显示和处理的习惯,对各有关页面显示、处理过程、 在线帮助等方面的显示信息进行了全面的中文化。通过对相关jsp文件及CSS文件的修改和调 整,对各级页面从内容布局、色彩搭配等方面进行了 美化设计和调整,提供显示主题和风格的定制和切换 的功能扩展。并在首页增加了有关最新提交、RSS订 阅等方面的功能。一一作者姓名处理的本地化。DSpace在对作者姓 名的处理上,将“姓”和“名”进行了分解和分别存 储的处理,这对于西方作者来说是合适的,但并不符 合中文姓名的处理和显示习惯。在不改变数据逻辑的 基础上,对有关提交和显示过程

15、的程序进行了修改, 以使中英文姓名都能以比较习惯的方式得到显示和处 理。中文排序的支持。DSpace通过支持Unicode编码标准以实现国际化设计和支持,但这样带来的问 题是无法支持按照汉语拼音顺序来对显示结果进行排 序。集成有关的开源软件包以及对结果显示处理的程 序进行了修改,实现了按照汉语拼音顺序显示浏览和 检索结果的功能。?元数据应用规范的扩展。DSpace支持以基于扩 展的DC元数据标准为基础的元数据应用规范,我们 主要从适应研宄所提出的对多种类型的数字内容类型 的描述和显示的要求基础上,通过元素修饰符扩展的 方式进行了扩展,如根据学位论文、会议论文等的特 殊描述和显示需求,做了 10

16、多项有关的扩展。?提交流程和界面的调整。DSpace默认的内容提 交流程步骤较为繁琐,有关的提交界面也常常被分解 到几个页面中。我们在保留默认提交流程及界面的情 况下,提供了一套简化的流程及界面,以满足一般的 内容提交和编辑习惯。?数据的批量导入功能。主要进行了从研究所ARP、 图书馆自动化系统等系统中将有关数据导出和导入IR 的专门工具的扩展开发。对有一定通用性的工具,将 考虑集成到DSpace系统中,方便用户的使用。对于那 些只是在系统初装过程中等场合使用的一次性数据导 入导出工具,则主要以外部程序的方式提供使用。?存取控制的强化。扩展了基于IP地址和用户组 的数字对象访问控制功能,以满足研宄所制定灵活的 IR内容访问许可策略。?数字对象的访问统计功能。扩展实现了基于信息 条目级的访问利用统计功能,可以方便作者对发布在 IR中的科研和学术成

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号