图书馆馆藏建设新元素——数据集

上传人:飞*** 文档编号:10301929 上传时间:2017-10-07 格式:DOC 页数:4 大小:31KB
返回 下载 相关 举报
图书馆馆藏建设新元素——数据集_第1页
第1页 / 共4页
图书馆馆藏建设新元素——数据集_第2页
第2页 / 共4页
图书馆馆藏建设新元素——数据集_第3页
第3页 / 共4页
图书馆馆藏建设新元素——数据集_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《图书馆馆藏建设新元素——数据集》由会员分享,可在线阅读,更多相关《图书馆馆藏建设新元素——数据集(4页珍藏版)》请在金锄头文库上搜索。

1、图书馆馆藏建设新元素-数据集安艳杰(南京财经大学仙林校区图书馆 210046)文摘 随着定量分析研究的增多,学者 们对数字数据的需求不断增加,数据集日益成为馆藏建设的新领域。文章阐述了数据集 类型及获取途径,分析了图书馆在自建和引进数据集中应注意的问题,提出图书馆应积 极占领数据集市场,与数据集生产商相抗衡。关键词 馆藏建设 数据集 数字数据Datasets:The New Element of Library Collection DevelopmentAn Yanjie(Library of Xianlin Campus of NanJing University of Finance &

2、 Economics 210046)Abstract: As scholarship places increasing emphasis on quantitative analysis ,the need for numeric data grows across academic disciplines. Datasets are becoming as new areas of the librarys collection development. The text expounds the types and ways for acquire of datasets , analy

3、ses the problems that library must pay attention to when confronting with datasets. At last , the author puts forward that the library should take possession of the datasets market。Key words: Collection development Data service Numeric data随着定量分析研究的增多,学者们对数字数据的需求也就越来越普遍。就高校图书馆而言,从简单的描述性统计资料到大型的数据分析,

4、都在日益成为广大师生学习和科研必不可少的资源。数据和数据集目前在信息市场中占有非常重要的地位。许多家公司开始对数据产品市场化,把数据获取作为一项增值服务。如 Knovel 公司正在对一些精品数据进行数字化并对外提供参考服务,以一种允许研究者操作和互操作数据的方式来转售这些信息。Nature 出版集团最近也通过把在线文章对数据的支持作为给用户提供的增值产品。在商家利用数据产品提供服务的同时,国外的许多高校图书馆也都自建或购买了数据集,为本校师生开展数据服务。 1 数据集的概念及类型1.1 数据集的概念所谓数据集,即为“数字数据产品”的集合,这里所说的“数字数据产品” ,是指“拥有相当多数字内容的

5、信息资源,不论其是印刷或是非印刷的资源。 ”1.2 数据集的类型数据集按产品形式可以分为在线,光盘,本地数据文件,印刷,缩微,WEB 网页以及最新出现的 DVD 产品类型。按产品内容可以分为索引、文摘型和全文型,如美国的统计索引,一直以来以书目索引的形式,帮助图书馆开展数字数据服务。最常见的是按数据集来源划分,主要可以分为以下几类:1.2.1 国际组织数据国际组织数据是图书馆获取数据产品的一个重要渠道,如 WB(世界银行) 、UN(联合国) 、 IMF(国际货币基金组织) 、 OECD(经合组织),在许多高校图书馆中都有收藏并提供服务。1.2.2 各国政府部门及统计机构数据如各国国家统计局、劳

6、动统计局、农业局、社会保障局等都存有大量的数据,从国外高校图书馆的数字产品数量来看,来自于政府各部门及统计机构的数据量相当丰富,这类数据集对研究者进行数据收集与比较提供了非常大的帮助。1.2.3 专业数据协会及数据联盟数据在北美地区,专业数据协会和数据联盟一直发挥着重要作用。如世界上最大的社科类研究数据存储-密歇根大学的政治和社会研究方面的校际联盟(ICPSR) ,在 1995 年成立了一个委员会,针对社会科学研究团体对国际性 codebook 标准的需要,开发描述社会科学数据集的结构化信息集。另外,还有位于康涅狄格大学的美国罗博公共意见研究中心(Roper Center)。美国研究图书馆协会

7、大部分成员都加入这两个数据组织。另外,较为著名的数据协会还有欧洲社会科学资料档案协会(CESSDA), 欧盟委员会设立的网络社会科学工具和资源 (NESSTAR).其他还包括欧洲政治研究协会,加拿大的加拿大统计以及 DLI 等。1.2.4 数据集产品供应商数据数字数据产品获取的另一重要渠道便是产品供应商。在美国 ARL 图书馆成员数据产品调查中,图书馆的数据产品约有 50%是通过商业供应者购买的。有以提供数据内容为主的,如 LEXISNEXIS 统计库,也有提供数据分析交互使用的,如沃顿研究数据服务(WRDS) ,国内的 CSMAR,WIND 数据库也这样的功能。2 数据产品获取途径2.1 制

8、度成员模式在制度成员模式中,图书馆每年代表自己的用户付一定的费用,成为收集,保存利用数据集的一个组织的成员。成员所付的费用足可以让自己的用户无限制地使用数据集。这种模式的好处就是图书馆可以免费保存和组织这些数据。一般情况下,这种机构都隶属于某个学术机构。如前面所提到的 ICPSR,及 Roper Center 都采用这种模式。2.2 连续订购模式在这种模式下,数据往往通过 CD 光盘或其他物理形式传递,并且定期获得内容。例如美国国家标准技术机构 (ZIST)、统计年鉴等就是以光盘形式获取。这种模式最大的障碍就是不能及时获取。2.3 一次性付款模式另外一个通用的模式是每个数据集一次性付款模式。如

9、同于图书馆最熟悉也是最常用的购书方法。获取数据集的这种方式往往受驱于用户的需求。如,一位科研人员认为一种数据集对他非常有用,需要采购作为馆藏。采购的程序类似于购书,但是对数据集的采购要远远高于图书的采购价格。通常数据集供应商也会采取这种方式,但因每年度更新,还会在一次性付款的基础上,每年度收取更新费用。2.4 代理模式这种模式相较前面的三种比较独特,他们代表了一种过渡的状态。或者是正向稳定发展的商业模式过渡。可能对于图书馆来说将是一种长期的获取模式。这种模式可以称是图书馆与数据生产者之间的代理安排。数据大多来源于前面所述国家、县、市政当局。一些政府实体为了补偿所耗费用收取一些费用。另外一些则愿

10、意把数据交给图书馆进行维护管理,减少政府或者数据生产者维护数据的费用。而图书馆则可以为他们的研究者们提供数据。2.5 免费注册或赠与模式除了前面所述几种模式外,一种非常重要也是受图书馆与研究者喜爱的模式便是免费注册与赠与模式。图书馆可以得到政府及其他同行的帮助,不需要费用便可以使用资源 。读者还可以通过网上免费注册,获取到如国际货币基金组织、世界银行提供的重要数据。另外,很多的数据生产者和机构并没有一套完整的方法来满足图书馆的数据需求。这样,图书馆就可以掌握主动权,对于数据的销售模式及方式都有主动权力。3 数据集馆藏建设应注意的问题数据集在学术研究中发挥着越来越重要的作用,数据集在图书馆(特别

11、是高校图书馆)中的地位会越来越重要,这是不争的事实。纸本期刊向电子期刊的转化过程提示我们:不久的将来,数据集的获取和收藏会成为影响馆藏建设的核心要素。图书馆在数据集的馆藏建设方面应注意中以下几个问题。3.1 自建和引进相结合,积极占领数据集市场面对日益重要的数据集,图书馆需要考虑一个问题:谁来把握数据集市场?在过去馆藏重点向电子刊的过渡中,许多图书馆都期待着低收费或甚至免费获取期刊内容。同时,也希望在馆藏预算上更加灵活。而事实上,图书馆不得不为在线获取付出更高的费用,同时,在期刊的选择上却缺少应有的自由。面对数据集这个新的馆藏建设领域,图书馆应吸引电子刊馆藏转变中的经验和教训,要快速行动起来,

12、在商业市场还不是很明朗之时,明确馆藏建设目标,依据自建和引进相结合的原则,多种途径与数据集产品的信息源创造者合作,把获取的数据作为本地建设资源,并建立自己的数据集存储。那么可以预见,图书馆在数据集市场中会占有显著的控制地位。正如收集和获取电子期刊一样,收集和获取数据集会成为许多图书馆的常态。收集数据集会给图书馆提供很多机会,可以帮助引导萌芽的商业模式,平衡数据集市场。到那时,正如用户期待符合他们的图书和期刊,他们一样可以期待图书馆提供大量的数据集。3.2 制定购置比例,合理使用经费专家们普遍认为,随着包括数据集在内的馆藏产品的不断丰富,图书馆在经费分配上将越来越难以做出决策。面对数据集产品,图

13、书馆必须解决一个问题,那就是若使数据集成为馆藏建设整体的一个部分,如何合理分配经费?在美国研究图书馆协会(ARL)对成员馆的数据集产品调查中显示,有 42%的成员馆对数据集有一定的经费分配。但很多数据集产品因其分散性,并没有固定的馆藏建设预算。但鉴于长期发展,图书馆必须全面考虑数据集的经费问题。另外,图书馆应考虑到有关收藏数据集时带来的隐性费用预算,如图书馆为适应研究者对数据集获取的需求,要建设自己的用户交互界面。这样,要考虑设备存储经费预算问题。3.3 注重数据集的选择和评价除了给数据集安置一定的经费预算,图书馆更应关注它的选择和评价过程。首先,图书馆要考虑选择收藏什么样的数据集。数据集的收

14、藏内容由以下几个因素决定。第一是用户的需求。根据需求,图书馆可以与数据拥有者建立合作伙伴关系,并协商出双方都可接受的获取模式。第二是数据生产者的价值体系。如数据集的包装、销售方案都会影响图书馆的采购。第三个潜在因素是图书馆是否在早期已有自己的收集策略。其次,图书馆要有从制定政策到实施的计划。目前,数据集并没有真正成为馆藏发展政策的一部分。图书馆可以明确地把数据集作为馆藏发展的政策和计划,并确定馆藏发展参数比例。第三,建立数据集选择的评估机制。到目前为止,在数据集选择时,没有一个固定的评估标准,有专家建议类同于学术期刊设定同行评价标准,而有人则认为这样会影响学术交流的过程。除了内容评价,图书馆需

15、要考虑数据集外在评价。如数据集存储和显示的需求,交互平台是否易用,是否可以互操作。另外,数据格式是否可以转换,数据是否为广泛认可的格式也是需要考虑的内容。3.4 合理使用数据,理性谈判当数据集越来越有价值,数据集的生产者们看上去更加想保护他们的投资。最近在美国,事实的数据不受版权保护。只有创造性的数据才会受版权保护。然而,自从 1996 年,欧盟指定数据库作为事实型的馆藏,不论是否有任何创造性的元素。都被认作版权保护,不可抽取和再使用。当数据集被看作一种投资,图书馆为他们的用户提供数据会面临费用和法律的障碍,作为数据收藏的图书馆,要规避法律风险,在法律允许的范围内合理收集和使用数据。另外,在采购谈判中,图书馆要考虑为了获取,哪些条件可以接受,哪些条件不可放弃。比如是否可以永久保存获取,是很重要的问题。参考文献1 Michael N. Cook. Products and Services. SPEC Kit 263 (Washington, D.C.: ASL, Office of Leadership and Management Services, 2001)安艳杰,女,馆员,硕士研究生, 毕业于南京大学信息管理系。已发文 8 篇,参编著作 1 部。现任南京财经大学参考咨询部主任。(收稿日期:2007-2-24 编发:许桂菊)

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号