欧美地区中文古籍数字化概述.doc

上传人:小** 文档编号:89215854 上传时间:2019-05-21 格式:DOC 页数:5 大小:36KB
返回 下载 相关 举报
欧美地区中文古籍数字化概述.doc_第1页
第1页 / 共5页
欧美地区中文古籍数字化概述.doc_第2页
第2页 / 共5页
欧美地区中文古籍数字化概述.doc_第3页
第3页 / 共5页
欧美地区中文古籍数字化概述.doc_第4页
第4页 / 共5页
欧美地区中文古籍数字化概述.doc_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《欧美地区中文古籍数字化概述.doc》由会员分享,可在线阅读,更多相关《欧美地区中文古籍数字化概述.doc(5页珍藏版)》请在金锄头文库上搜索。

1、欧美地区中文古籍数字化概述毛建军(新乡学院中文系,河南 新乡 453000)文 摘 本文对欧美地区中文古籍书目数据库和古籍全文数据库建设情况作了较为全面的调查和分析。关键词 欧美地区;古籍数字化;书目数据库;全文数据库Outline on Rare Books Digitization in Europe and America Region Mao Jian-jun(Chinese Dept. Xinxiang University, Henan Xinxiang, 453000)Abstract:In this paper, we survey and analysis the situa

2、tion of rare books bibliographic database and rare books full-text database in Europe and America region.Key words:Europe and America region; rare books digitization; bibliographic database; full-text database1中文古籍书目数据库的建设欧美地区东亚图书馆所使用的编目系统为RLIN-CJK或OCLC-CJK 系统。如果欧美前15 到20 名东亚图书馆都完成数字化,就会有国家级的在线中文数据书

3、目。1截至目前,欧美地区进行中文古籍机读编目的单位主要有美国图书馆研究学会、哈佛燕京图书馆、美国国会图书馆以及大英图书馆等大型国家级图书馆。1.1美国图书馆研究学会(RLG)“中文善本书目数据库”美国图书馆研究学会(Research Libraries Group,简称RLG)由北美36家图书馆组成,其宗旨是通过计算机数据库的联网实现馆际资源的共享。从上世纪90年代之前,RLG成员包括中文古籍收藏者以及汉籍目录学专家就开始为编制中文古籍书目做过努力。1990年RLG东亚计划委员会(EAPC)开始了“中文善本书目数据库”计划,该计划预计将中国清代嘉庆以前的古籍全部进行机读编目。其最终目的是让读者

4、能够通过网络轻松地找到中国史料,为学者提供中文古籍收藏地线索,并可以提供不同版本的文本。2 计划第一阶段已成功地将台北国立中央图书馆的机读古籍书目转换成RLIN数据库中。第二阶段于1989年9月完成。由中国北京大学、中科院的5位古籍编目专家及美国普林斯顿大学、哥伦比亚大学的东亚图书馆的专家进行编目测试和中文善本书目规则草案的修正。第三、四阶段进行集中编目。3目前数据库有25000条数据,并在不断扩充之中。41.2哈佛燕京图书馆“线装古籍计算机检索系统”哈佛燕京图书馆隶属于哈佛燕京学社和哈佛文理学院图书馆,是西方收藏东亚文献最多的大学图书馆之一,藏书达到90万册,其中中文书籍有56万册,包括普通

5、线装书16000余部,善本4000余部,方志3800余种,家谱1000余种。2003年哈佛燕京图书馆邀请复旦大学图书馆眭骏、杨光辉等专业学者帮助完成这1800余种古籍线装图书的计算机编目工作。目前编目工作已经结束,读者可在哈佛燕京图书馆馆内的“线装古籍计算机检索系统”查询。42005年,哈佛将开始由“美隆基金会”(Mellon Foundation)赞助的哈佛数字典藏先导计划(LDI 计划),将继续有关储存与典藏数字资源的建设和探讨。11.3美国国会图书馆Online CatalogOnline Catalog为美国国会图书馆的书目检索系统。美国国会图书馆为美国收藏中文书籍最丰富的地方,收藏有

6、8600多万件图籍,另外还有3600万份手稿。其中中文古籍754300册,地方志4000余种,中文善本1200种。包括宋元明清善本书、地方志和罕见的珍本图籍。Online Catalog于1995年投入使用,后经过多次扩充和更新,使用者需以汉语拼音输入检索条件,数据结果以英文呈现。51.4大英图书馆“中文图书联合检索”大英图书馆典藏中国珍贵文献和古籍60000多种。大英图书馆于1980年开始采用MARC磁带建立“古版书简明标题目录”(Incunable Short Tit-1e Catalogue,简称ISTC),是全球该类文献最大的联机数据库,主要收载15世纪用活版印刷的文献题录。6ISTC

7、数据库的来源主要为英国图书馆收藏的1501年以前印刷的文献的题录和两个重要的联合目录Go-ff和IGI,除此之外,还收录了包括部分中文古籍的书目。6“中文图书联合检索”包括大英图书馆与牛津大学、剑桥大学等六所大学、研究所的图书馆所收藏的中文书籍,含中文古籍。使用者可直接输入中文或汉语拼音来查询书目,所得信息也以中文显示。2中文古籍全文数据库的建设在欧美,收藏中文古籍最为丰富的一般是国家图书馆。随着各国数字图书馆计划的实施,许多中文古籍作为计划中的一部分也被数字化处理并运行于网络。美国国会图书馆于1982年开始计划以最新技术的光学磁盘来储存图像。1995年美国国会图书馆开始实施国家数字图书馆计划

8、(NDLP),旨在使国家图书馆特藏文献诸如手稿、地图、古籍进行全文图像的数字化处理。71998年开始实施“国家数字构建储存计划”(The National Digital Information Infrastructure and Preservation Program),计划将所有藏书资料数字化。这项计划将创建一个庞大的“虚拟图书馆”,所有的图书、绘画、手稿和照片都将转化成数字化图像并通过国际互网络传送到世界的任何终端用户。在中文古籍方面 ,“American Memory Pilot Project”(美国记忆导航计划)已成功的将该馆21万件馆藏予以数位化处理。目前已有500万个数字化

9、影像,包括部分中文古籍图书资源。8哈佛燕京图书馆与加拿大麦基尔大学东亚系合作将中国明清时期的妇女著作进行了数字化并上传到网络。该项目包含了目前珍藏在燕京图书馆的54种明清妇女著作以及相关5000位女作家的上万首诗词作品以及数以千计的中国历史地名和近2万张原始图片数据。该数据库为中国古代妇女研究提供了强大的检索工具,数据库同时提供汉字繁体和拼音的查询。可按照人名、书名、略传、诗体、词牌、文体、词话、诗话、年号、干支等途径检索查询。4 柏克莱加州大学东亚图书馆收藏中文线装古籍计有数万册。其中以宋元版图书居多。为了保护好这些珍贵古籍,柏克莱加州大学东亚图书馆与1998年开始实施拓片古籍数字化计划。2

10、001年完成2700册拓片编目,2002年完成28000片拓片图像扫描。以后逐步推行到古籍图像数字化。3目前已完成200余部古籍的数字化工作。该数据库可进行浏览阅读、目录检索和关键词检索。大英图书馆于1993年发布了“2000年规划目标” (Strategic Objectives for the Year 2000),计划到2000年实现馆藏文献数字化并运行于网络,为全球读者尽可能的提供检索和阅读其馆藏。91995年,大英图书馆开始实施“数字化图书馆计划”(The Digital Library Program),其中两项计划与珍藏文献有关。10一是The Electronic Beowul

11、f(简称EB),二是British Library Images Online。EB计划是将11世纪盎格鲁撒克逊史诗手稿和丹麦皇家图书馆所藏18世纪相关稿本进行数字化。British Library Images Online是将大英图书馆馆藏珍罕文献影像数字化,目前在线的中文影像数字资源还很少,但也可窥见部分珍贵的中文古籍如手写本的中国古代地图急救篇等。俄罗斯东方研究院Digitization of the Dunhuang Collection 计划。该计划要将俄罗斯科学研究院圣彼得堡分校(Russian Academy of Sciences, St. Petersburg)东方研究院(

12、Instituteof Oriental Studies)和前亚洲博物馆(Asiatic Museum)的中文手稿进行编目与储存。亚洲博物馆的中文馆藏包含敦煌馆藏拓片典藏、中文木板印刷书籍典藏、地图典藏、PortArthur 典藏及Khara-Khoto典藏等。东方研究院中文手稿的数字化包括书目信息以及手稿、文献、拓片、画作影像。敦煌数字图书馆包含石窟艺术的数据库及相关的手稿与学术文本。11除了图书馆、科研院所等单位进行中文古籍数字化资源的开发建设以外,网络中还存在一部分研究协会或个人建设的中文古籍数字化资源。这些中文古籍数字化资源往往以专题网站的形式出现,尽管有些专题网站的内容从严格意义上不

13、能称之为“古籍”,但从传播中国古代文化的角度,我们还是不应该忽视的。这些中文古籍数字化资源主要以普及中国古代文化或进行国际文化交流为目的,因此所建设的资源多数以常见的中国古代典籍为对象,在资源模式上以免费共享为特征。“古藤堡计划”(Project Gutenberg,简称PG)是一个大型的图书共建共享计划,目前有8000余种经典图书。“古藤堡计划”由美国伊林诺斯大学文理学院米歇尔哈特(Michael SHart)倡导,收录那些可以无限复制、具有公共版权的图书,内容则以哲学、文学和历史主题为主,其中包含了中国经典、文学、历史和地图等方面书籍和资料的数字化内容,如论语史记三国演义红楼梦等。“古藤堡

14、计划”的电子文本以“Plain Vanilla ASCII”方式获取,可进行目录检索,用户直接输入检索词即可找到相关图书。12“周易电林”网页主要收集国际互联网上以各种语言登载的有关易经研究的信息和著作,包括中文易经、原文翻译、易经评注等栏目。“新语丝”由美国新语丝中国文化学会主办。该网址主要是将中国的散文和诗歌建成数据库。与中文古籍数字化相关的栏目有电子文库、中华大百科等。133国际合作开发建设中文古籍数字化资源国际合作是中文古籍数字化开发建设的一种重要形式。中外合作是目前国际合作的主要运作模式。国际合作开发中文古籍数字化资源可以实现优势互补,中国国内具有丰富的古籍资源优势,国外则可提供资金

15、和技术条件,而开发的资源在网络共享的基础上,既可以满足国外对中文古籍的研究需求,也有利于中国文化的传播。因此,国际合作开发中文古籍数字化资源具有广阔的发展前景。“国际敦煌项目”(The International Dunhuang Project,简称IDP)是目前国际合作开发中文古籍数字化资源规模最大也最成功的合作项目。“国际敦煌项目” 由大英图书馆于1993年发起,参与单位有中国国家图书馆、法国国家图书馆、俄罗斯圣彼得堡东方研究院、柏林国家图书馆等。IDP的宗旨是通过国际合作,开发各国所藏敦煌文献并全部实现数字化,让全球的研究人员网络共享,从而促进敦煌学的研究。项目包括建立国际敦煌工程数据

16、库、研究保护敦煌遗书的新的技术手段等多项内容。IDP专门设计了专用数据库,建立一套编目数据体系,并对写卷、吐蕃文残片进行图像数字化处理。1998年10月数据库正式上网,有2万个记录可供检索。到2002年建立了4万条数据,包括绘画、工艺品和历史照片,目前已有5万余件中亚写卷和印本以及3万余件中国国家图书馆馆藏敦煌文献资源数据。14 “中美百万册书数字图书馆计划”(China-US Million Book Digital Library Project)由美国卡内基梅龙大学Raj Reddy博士、西蒙学院陈刘钦智博士(Ching-chih Chen)和中国科技大学高文博士共同发起的旨在建设包含100万册图书的数字图书馆研究与开发项目。计划通过4-5年的工作,组织100万册数字图书(中英文各50万册)上网。中国方面有浙江大学、北京大学、清华大学等

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号