科学大数据开放共享机制研究及其对环境信息共享的启示

上传人:小** 文档编号:34126819 上传时间:2018-02-21 格式:DOC 页数:13 大小:158KB
返回 下载 相关 举报
科学大数据开放共享机制研究及其对环境信息共享的启示_第1页
第1页 / 共13页
科学大数据开放共享机制研究及其对环境信息共享的启示_第2页
第2页 / 共13页
科学大数据开放共享机制研究及其对环境信息共享的启示_第3页
第3页 / 共13页
科学大数据开放共享机制研究及其对环境信息共享的启示_第4页
第4页 / 共13页
科学大数据开放共享机制研究及其对环境信息共享的启示_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《科学大数据开放共享机制研究及其对环境信息共享的启示》由会员分享,可在线阅读,更多相关《科学大数据开放共享机制研究及其对环境信息共享的启示(13页珍藏版)》请在金锄头文库上搜索。

1、科学大数据开放共享机制研究及其对环境信息共享的启示 诸云强 朱琦 冯卓 曾剑峰 郭春霞 傅为华 李威蓉 中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室 江苏省地理信息资源开发与利用协同创新中心 环境保护部信息中心 义乌工商学院 山东理工大学 摘 要: 科学大数据得以充分利用和增值的前提是开放共享, 而影响数据开放共享的关键问题是共享机制。本文首先分析了科学大数据的产生方式、数据类型、投资方式、管理主体和服务定位及其与共享程度的关系。进一步在分析国内外自上而下和自下而上科学数据共享通用机制与原则的基础上, 结合国家地球系统科学数据共享平台、全球变化科学数据出版等实践, 提出了数据

2、汇交、数据出版、数据联盟和服务激励四种数据共享机制, 并分析了每种机制中的关键问题及具体做法。最后, 结合云计算、“互联网+”等新一代信息技术和思维, 对环境保护大数据共享机制提出四点建议, 即:国家统一投资建设的环境保护核心业务数据强制汇交机制, 其他部委、机构环境保护相关数据联盟交换机制, 企业、科学家个人数据出版等激励机制, 以及社会公众数据的“众创机制”。关键词: 科学大数据; 环境保护; 共享机制; 数据汇交; 数据出版; 众创; 作者简介:诸云强 (1977) , 男, 博士, 中国科学院地理科学与资源研究所研究员, 研究方向为地学数据共享关键技术、资源环境信息系统。基金:科技基础

3、性工作专项重点项目 (2013FY110900) Scientific Big Data Sharing Mechanisms Research and Suggestions for Environmental Information SharingZhu Yunqiang Zhu Qi Feng Zhuo Zeng Jianfeng Guo Chunxia Fu Weihua Li Weirong State Key Lab of Resources and Environmental Information System, Institute of Geographic Sciences

4、 and Natural Resources Research, Chinese Academy of Sciences; Information Center, Ministry of Environmental Protection; Yiwu Industrial Shandong University of Technology; Abstract: The foundation and precondition of full using scientifi c big data and excavating their values is to open and share the

5、se data. Among impact factors of data sharing, the sharing mechanism is the most important. In this paper, firstly scientifi c big data characteristics were analyzed. Several factors of scientific big data including datas generation mode, type, way of investment, governor and functional orientation

6、will profoundly influence their open and sharing. Generally, scientific data sharing mechanisms are made by top-down or bottom-up approaches. The basic ideal of data sharing mechanism is to open and share data at maximum extentand meanwhile to protect reasonably interests of data contributors. After

7、 that based on the experiences of National Data Sharing Infrastructure for Earth System Science and Global Change Research Data Publication etc., authors put forward four data sharing mechanisms, i.e. data submission, data publication, data alliance, and service excitation, for respectively public a

8、nd private data. Finally, considering thelatest IT and their ideas, like Could Computing and Internet plus, some sharing mechanism suggestions were proposed for environmental protection (EP) big data that are mandatory submission mechanism for EP core data funded by public finance, federal exchange

9、mechanism for trans-ministries EP related data, and incentive mechanism, like data publication, for enterprise and scientist individual data as well as crowd innovation mechanism for the public data.Keyword: scientific big data; environmental protection; sharing mechanism; data submission; data publ

10、ication; crowd innovation; 引言科学数据是指人类社会科技活动所产生的基本科学技术数据、资料以及按照不同需求而加工的数据产品和相关信息1。科学数据是国家宝贵财富和战略资源, 不仅关系到国家的科技进步与创新能力, 而且也是社会经济发展决策的基础。科学数据通常分为两大类型, 一类是行业部门按照统一的规范标准长期采集和管理的科学数据;另一类是国家各类科技计划项目在研究过程和结果中产生的, 以及为支持科学研究而通过观测、监测、试验等站点采集的科学数据2。自 20 世纪 70 年代起, 科学数据共享已经受到广泛的关注, 一系列国际数据组织/ 计划、国家数据中心和共享动议先后成立和

11、启动3。如, 国际科联 (ICSU) 的国际科学技术数据委员会 (Committee on Data for Science and Technology, CODATA) 、世界数据中心 (系统) (World Data Center or System, WDC or WDS) 4、地球观测组织 (Group on Earth Observations, GEO) 、研究数据联盟 (Research Data Alliance, RDA) 和全球生物多样性信息机构 (Global Biodiversity Information Facility, GBIF) 等, 美国建立的分布式最活跃

12、数据档案中心群 (Distributed Active Archive Centers, DAACs) 、 全球变化主目录 (Global Change Master Directory, GCMD) 、国立卫生研究院数据共享库 (NIH Data Sharing Repositories) 、 地球观测数据网 Data Observation Network for Earth, Data One) , 欧洲空间信息基础设施 (INSPIRE) 、加拿大的地球观测数据网 (The Canadian Earth Observation Network, Geo NET) , 中国启动的科学数据

13、共享工程、国家科技基础条件平台 (National Science and Technology Infrastructure, NSTI) 等。从国际上看, 科学数据共享已经成为一种普遍性行为, 但发展极不均衡5。各国科学数据共享发展不均衡的根本原因在于背后政策和共享机制的不同。尽管我国已经出台了一系列数据共享相关的政策和条例, 然而这些政策和条例都有这样或那样的限制, 极大影响了科学数据的共享, 国家层面完善的数据共享机制, 特别是针对不同类型和来源的科学数据共享机制并未形成6,7。因此, 研究分析不同模式的共享机制, 对于推进科学数据共享具有重要的意义。特别是科学大数据的到来, 一方面人

14、们越来越意识到数据的价值, 更加注重数据产权的保护;另一方面大数据产生方式和利用模式的转变, 都要求我们重新审视和积极探索新的数据共享机制。本文首先分析科学大数据及其来源特征;然后结合国家地球系统科学数据共享平台和全球变化科学数据出版等实践, 研究分析不同来源的科学大数据共享机制及其关键问题;最后, 给出环境保护数据开放共享机制的建议。1 科学大数据及其共享特性分析大数据是指无法在可容忍的时间内用传统 IT 技术和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合8。与科学相关, 反映和表征着复杂的自然和社会科学现象与关系的大数据称之为科学大数据。除具有一般科学数据的特征 (客观性、分离

15、性、长效性、不对称性、非排他性、可传递性、增值性) 9和大数据的特征 (4V:Volume 体量浩大、Variety模态繁多、Velocity生成快速和 Value价值巨大但密度很低) 外, 科学大数据还具有高维 (具有多重数据属性) 、高度计算复杂性 (大多为非线性复杂系统) 和高度不确定性 (具有一定的误差和不完备性) 等特征10。从产生方式来看, 科学大数据主要来源于地面观测 (监测) 、遥感遥测, 考察调查、统计分析, 实验测试, 加工处理、计算模拟, 互联网挖掘等手段;从数据类型来看, 科学大数据包括空间数据 (矢量、栅格等) 、非空间数据 (数据库表、数值文本、统计图等) 、多媒体

16、数据 (文档、图片、音频、视频等) ;从投资方式来看, 科学大数据主要由国家和地方财政、单位自主经费和个人经费等投资产生;从管理主体来看, 科学大数据主要由专业机构 (数据中心) 、科研团队和科学家个人等管理;从服务定位来看, 科学大数据主要包括研究型 (研究项目产生的数据) 、资源型 (特定领域公共的数据库) 和参考型数据 (长期积累的基础性数据) 11。不同产生方式、数据类型, 投资方式、管理机构、服务定位的科学数据, 其开放共享的程度也不同 (图 1) 。图 1 科学数据共享程度线性模型示意 下载原图图 1 显示, 科学数据获取方式越容易, 意味着获取成本越低, 其共享也会越容易;科学数据类型越与地理空间位置无关, 保密程度就会越低, 而开放共享限制也会越低;科学数据管理主体从个人、到团队再到专业机构 (如数据中心) , 管理的专业程度和稳定性就会越来越高, 因此, 就会越容易共享;科学数据共享的法理基础是纳税人, 税收是政府财政的主要来源, 国家投资产生的科学数据应当向纳税人实行共享

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 管理论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号