学位论文元数据元数据草案

上传人:j****9 文档编号:54578405 上传时间:2018-09-15 格式:PPT 页数:60 大小:431.50KB
返回 下载 相关 举报
学位论文元数据元数据草案_第1页
第1页 / 共60页
学位论文元数据元数据草案_第2页
第2页 / 共60页
学位论文元数据元数据草案_第3页
第3页 / 共60页
学位论文元数据元数据草案_第4页
第4页 / 共60页
学位论文元数据元数据草案_第5页
第5页 / 共60页
点击查看更多>>
资源描述

《学位论文元数据元数据草案》由会员分享,可在线阅读,更多相关《学位论文元数据元数据草案(60页珍藏版)》请在金锄头文库上搜索。

1、“CALIS高校学位论文全文数据库”项目 参 建 馆 本 地 系 统 需 求 方 案 清华大学图书馆 2004年4月10日,主要内容:,子项目系统软件开发进展和设计原则 CALIS学位论文子项目总体结构框架 参建馆本地系统结构框架 参建馆本地系统各功能模块介绍 参建馆本地系统需要支持的接口 存在的问题,子项目系统软件开发进展,2003年9月末举办第一次培训,参加学校约50所。到目前为止,约有35家已经运行“学位论文本地提交和发布系统”,绝大部分学校购买了成熟的商用软件; 2004年2月末,CALIS管理中心对各个子项目承建单位进行了统一的技术培训,要求各子项目系统开发需要满足一定的技术标准和元

2、数据标准; 2004年34月,各商家根据新的需求重新完善各自的系统;因开发时间比较紧张,系统的有些功能(如统一认证、统一结算等)没有列入开发进度,本次培训中不能演示;,子项目系统软件开发进展,4月中旬,清华图书馆对本次会议需要演示的四种学位论文系统作了统一的安装测试,各家系统都有待于继续完善; 5月6月初,希望各商家逐渐完善系统,各与会单位选择本地系统软件,争取6月初在本馆正式运行; 6月,各商家增加新的功能模块(如认证、结算) ;CALIS和子项目中心将对系统涉及到的标准和接口做统一的测试;,子项目系统软件设计原则,遵循国际上通用的标准规范(如 OAI-PMH协议); 遵循CALIS制定的标

3、准规范(如CALIS-OID,METS); 需遵循子项目组的规定;(如文件名命名规则,学位论文的核心表单配置等) 平台无关性,提供多种平台供参建单位选择,各参建单位可根据本馆数字图书馆平台的现有状况,选择“学位论文提交和发布系统”; 结合学位论文本身特点,实现系统的特殊功能。如学位论文DRM控制;,论文提交 发布系统,参建馆 本地系统,CALIS中心,应用集成接口(ODL),资源调度系统,子项目中心,OAI harvester,OAI-PMH,OAI接口,METS接口,集中的 元数据库,METS harvester,Fetch接口,CALIS-OID本地解析,中心门户,CALIS中心解析器,统

4、一认证,统一结算,子项目与参建馆数据结算,日志与统计,论文长期保存接口,日志与 统计,用户结算,用户认证,CALIS学位论文全文数据库项目总体结构框图:,计费 子系统,日志与统计 子系统,OAI 接口,用户认证与管理 子系统,METS 接口,链接目标 (CLRC接口),网站基本服务子系统,本地学位论文提交和发布子系统,本地CALIS-OID解析子系统,本地学位论文 长期保存模块,参建馆本地系统结构框图:,标红的可考虑延后实现,在本次培训中不介绍,学 生,本地学位论文提交与发布子系统-1,标红的可考虑三期实现,提交模块(续1):,提交权限认证不需要认证需要认证(一般选择“姓名+学号”作为认证条件

5、,认证信息可批 量导入,认证信息非明文传输或在传输中使用校验码) 提交表单包括两部分:1) “核心表单”项目,建议系统将这些项目固化,管理员在配置表单时不得更改。 “核心表单”中项目的著录必须遵照学位论文描述性型元数据规范。核心表单中有固定取值的项目提供可配置的下拉菜单,例如学科、学位级别等。下拉菜单的值由项目组确定; 2)根据本校需要配置的项目。,提交模块(续1) :,提交的全文文件格式:包括:论文全文格式选择:包括word97,word2000, word xp,PDF,ZIP (仅限于使用Latex的*.ctx和*.pdf文件压缩成的ZIP文件) 论文全文命名规范 “学校代码+学号+姓名

6、+论文全文格式.扩展名”组合来确定文件名(每一段之间用下划线“_”相连)。 例如:211030_980021李明_97.doc 提交结果查询,审核模块(续1) :,记录处理:按院系分配论文审核任务;不合格信息通过自动发Email或web查询方式通告学生 ;共性的不合格信息,系统可给出其列表提审核员选择;不合格信息可由管理员配置;审核员有修改论文元数据和全文的权限;记录统计: 按院系统计记录的处理状态(未处理、合格、不合格),审核员的工作量等,统计结果可作各种排序;,论文编目模块(续1) :,描述性元数据编目核心表单项由学生提交,审核员审核,主要是指增加馆藏号管理型元数据编目 主要是增加论文服务

7、年限、服务范围和pdf文件大小服务范围包括2级:校园网内、CALIS参建单位内服务年限:2种不同服务范围有不同的服务年限可批量加入, 或一条条加入系统根据以上信息自动控制论文的发布范围和访问权限pdf文件大小:要求系统自动生成,包括前16页和全文回溯历史数据的编目,文档标准化模块(续1) :,自动批量转换word到pdf文件; 生成2个pdf文件,一个是全文,一个是前16页; 完整的转换日志; 全文pdf文件的加密;(不能进行复制、打印、拷贝等操作) PDF文件命名规范Word在转换成pdf后,文件名中的“学校代码+学号+姓名+论文全文格式.扩展名”,论文全文格式部分去掉。前16页和全文文件名

8、的区别是:前16页文件名是在全文文件名的”.”前面加16。 例如:211030_980021李明_2000.doc转换成PDF后的文件名为:“211030_980021李明.pdf”(论文全文),“211030_980021李明16.pdf”(前16页全文)。,论文全文发布与检索模块(续1),检索: 浏览: 发布内容:论文文摘等元数据信息、论文前16页以及PDF格式论文全文;系统可对论文全文的访问权限进行基于IP的控制。 DRM控制:如需离线阅读PDF文件,系统需要提供接口,支持PDF文件与机器的硬件信息绑定,以免非法传递、拷贝pdf文件,即离线阅读的用户只能在合法的机器上才能阅读全文。,其它

9、功能(续1),数据备份:支持数据库的备份和数据文件的备份; 用户管理:支持多种用户身份(学生、编目员、审核员、系统管理员 ),可按身份配置不同的权限;格式转换:支持CCFC格式的数据导入;2)支持通过字段配置的MARC格式的数据导出。,OAI接口-2,子项目中心通过OAI harvester收割参建馆学位论文系统中的描述性元数据;因此,双方必须遵循OAI协议,提供OAI接口;,OAI协议介绍(续2),OAI协议,全称Open Archives Initiative Protocol for Metadata Harvesting; 1999年由美国数字图书馆联盟(DLF)、网络信息联盟(CNF

10、)等组织提出的一个应用框架; 最初是为了解决电子期刊的预印本(pre-print)的互操作和元数据收割(metadata harvesting)问题; 2000年OAI协议的应用扩展到数字图书馆领域,目的是实现分散的、不同系统平台之间的元数据交换和共享,提高系统的互操作能力,OAI协议介绍(续2),遵循OAI协议的系统依据其任务的不同,分为两类:Data Provider:对来自服务提供者的request做出response,以 OAI要求的格式(XML)向服务提供者提供元数据Service Provider:“收割”(harvest)元数据,并基于元数据提供 增值服务,Repository,

11、Data Provider,Data Provider,Data Provider,Service Provider,user,OAI Verb,Request,Response,Repository,Repository,Record,OAI协议介绍(续2),OAI协议是建立在http协议基础上的应用协议,OAI的请求使用HTTP中的GET或POST方法 每个OAI请求都必须包括一个名字为verb= OAI方法名每个方法名有若干个参数,当使用多个参数时,用“&”隔开 服务提供者可以使用OAI协议的“方法名”向数据提供者发出请求,按请求条件收割数据提供方的元数据 OAI的响应格式是通用的XML

12、编码,OAI支持的方法名(续2),OAI请求实例(续2),例如:请求http:/an.oa.org/OAI- script? verb=GetRecord & identifier=oai: arXiv :hepth/9901001&metadataPrefix=oai_dc表示使用的OAI方法是GetRecord,要请求得到identifier是oai:arXiv:hepth/9901001的记录,记录的元数据格式是oai_dc OAI协议规定,遵循OAI的系统必须支持DC格式,是否支持其它元数据格式可以由系统自行决定,,参建馆OAI接口需满足(续2),记录的DATESTAMP要求精确到秒

13、; 要求RECORDSTATUS(操作状态)是完备的,created, 2-updated, 0-deleted; 对学位论文,参建单位的仓储中不定义set ; 支持resumptoken功能 ; 系统需要支持CALIS-ETD元数据格式;,参建馆OAI接口需满足(续2),OAI-identifier 命名规则:oai “-” LocalPrefix “/” MetaID,其中:LocalPrefix表示6位馆数字代码,同一学校不同校区如使用不同的仓储管理学位论文,在馆代码上需要加以区分,例如:北京大学的馆代码为211010A,北京大学医学院(原北京医科大学)的馆代码为:211010B Met

14、aID“类型码+学号”(远程提交的论文) “学校代码+类型码+年份(4)月份(2)流水(6)”(回溯扫描的 论文,没有学号)类型码:远程提交的论文类型码为D,回溯扫描的论文类型码为R 例如: oai:211030:D890767,参建馆OAI接口需满足(续2),参建馆本地元数据仓储唯一标识符的命名规则:scheme “:” namespace-identifier “:” local-identifier 其中:scheme指oainamespace-identifier指6位馆数字代码local-identifier指etd例如:清华大学学位论文仓储唯一标识符为:oai:211030:etd

15、 参建馆本地仓储的安全访问机制 基于IP地址以及帐号、密码控制,METS 接口-3,子项目中心通过METS harvester收割参建馆学位论文系统中的管理型元数据和论文前16页文件。*传输格式:METS标准(记录的描述型元数据、管理型元数据、前16页PDF文件的二进制文件流。) * 传输方案:MQ(Message Queue ) ,MQ可在多个不同的应用之间实现相互通信的一种异步传输模式,具有可靠的消息发送、异步的消息发送和传输安全等特点 * 接口要求:遵循CALIS数字对象交换协议规范,METS标准(续),METS是Metadata Encoding and Transmission St

16、andard 的简称; 由Digital Library Federation发起,目前由国会图书馆的 network development and MARC standards office负责维护; METS能够解决数字对象的编码、描述、管理、交换、保存等问题;,METS标准(续),学位论文作为一种数字对象,如何用METS来表达复合数字对象:包含多于一个文件的数字对象都是复杂对象。 例如:一条完整的学位论文记录,包括前16页、全文、管理型元数据、描述型元数据。这构成了一个复杂的数字对象。 简单数字对象:简单数字对象是指一个有完整意义的独立文件,它由对象元数据及对象文件组成。 例如:论文前24页是一个简单的数字对象,论文全文也是一个简单的数字对象在实际应用中,根据需要使用简单的或复合的数字对象,METS标准(续),下面的一段代码即为一个METS文档的基本框架。Header(创建者、创建与修改时间等)Descriptive MetaDdataAdministrative MetaDataFile list(数字对象所包含的全部数字文件的信息,Flocat元素指向实际文件所在的位置。Fcontent元素可以封装XML文档或者二进制文件。 )Structural Map(必备的部分,定义数字对象的内部结构 )Behavior Section ,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号