文档详情

科学大数据范式重塑与价值实现

ss****gk
实名认证
店铺
DOC
63.44KB
约9页
文档ID:209278049
科学大数据范式重塑与价值实现_第1页
1/9

科学大数据:范式重塑与价值实现孙建军李阳摘要:大数据时代,科学研究与实践的各个领域与环节发牛了根木性变革,科学大数 据成为科技创新与应用的新引领,是新一轮科技革命的“引爆点”文章立足数 据科学与图书情报科学前沿,提出了一个兼具“技术理性”与“人文价值”色 彩的科学大数据范式特体文章认为:科学大数据的概念框架应兼具知识维度和 活动维度;科学大数据的“迭代优化”特征将会驱动其范式共同体的扩展与生态 系统的形成;科学大数据价值链的提升则需要通过资源、模式与内容等方面的优 化进行综合推进在新技术环境下,科学大数据具有广阔的应用前景,其范式重 塑与价值实现对于推进现代大科学研究理论与实践体系的建设具有积极意义关键词: 科学大数据;数据科学;范式;价值链;作者简介:孙建军(1962-),男,南京大学信息管理学院教授,博士生导师, 研究方向:网络信息资源管理、大数据分析;作者简介:李阳(1989-),男,南京大学信息管理学院博士后,研究方向:信息 资源管理、竞争情报收稿日期:2017-10-21基金:国家社会科学基金重大项目“面向学科领域的网络资源深度聚合与导航机 制研究”(项目编号:12&ZD221)研究成果之一ScientificBig Data:ParadigmRemodelingand Value RealizationAbstract:In the era of big data, scientific research and practicc have made sharp changes in several areas and links. Scicntific big data has become the new leadership of innovation and application of science and technology, as well as the "tipping point" of a new round of technological revolution.Based on the scientific frontier of data science and LIS (Library and infonnation science) , this paper puts forward a special scientific big data paradigm by integrating echnical rationality" and "humanisticvaluc,z. This paper states that the conccptual framework of scicntific big data should have both knowledge dimension and activity dimension. Meanwhile, the iterative optimization features of scientific big data will drive the expansion of the paradigm community and the formation of ecosystem. As it should be, the enhancement of the value chain of scicntific big data nccds to be comprchcnsivcly promoted through the optimization of resources, patterns and contents. Under the new technology environment, the scientific big data has broad application prospect, its remodeling and value realization are significant to the construction of modern big science research theory and practice system.Keyword:scicntific big data; data scicncc; paradigm; value chain;Received: 2017-10-21 1引言近年来,大数据热潮促进了数据科学的发展,尤其是计算机技术、互联网通信技 术、传感技术的持续创新,科学研究的数据化能力得到进一步提升,以大数据为 推动力的科学研究范围、方法、方式等发生了极大改变山。

在此背景下,科学 研究与工程实践不断推进,一系列大科学、大工程、大项目与大数据密切相关, 如“E级超算”项目、人类基因组计划、未来世界计划等科学大数据是科学研 究中的海量数据,它既取之于科学,也反过来影响和扩大更多的科学探索与应 用,成为架起数据科学与业务实践Z间的关键桥梁随着知识经济与科技竞争不 断白热化,新一轮的科技革命蓄势待发,科学大数据逐步成为重塑国家科技水 平与生产力的主导力量同时,政府管理与社会治理进入了新常态,科技发展进 入纵深发展的转折期,科学大数据管理迈向了新的节点和征程,科学研究、政府 决策、产业发展等越來越依赖于科学大数据以及对其分析的能力科学大数据是支扌掌国家科技创新的战略资源,党和政府高度重视科学大数据的 发展2015年8月,国务院发布的《促进大数据发展行动纲要》中,强调了发 展科学大数据,积极推动由国家公共财政支持的公益性科研活动获取和产生的 科学数据逐步开放共享,构建科学大数据国家重大基础设施,实现对国家重要 科技数据的权威汇集、长期保存、集成管理和全面共享等2016年8月,国务 院印发的《“十三五”国家科技创新规划》,其强调着力扩大科技开放合作,从 政策指引上部署了科技2030的大数据重大工程等。

不仅如此,科研机构也积极 参与科学大数据的相关实践,为了契合国家战略,中国科学院“十三五”信息 化专项专门设置和实施了科学大数据工程项目,以期通过重点数据库建设来推 动科学大数据的发展等在现实背景、社会需求与政策导向上,科学大数据的基础理论与实践推进已经成 为当前政府与社会关注的重要议题长期以来,数据驱动理念与科学研究现状的 固有矛盾一直制约着科学大数据的发展,新一代数据科学研究对科学大数据管 理与服务提出了更高要求然而,FI前关注科学大数据的学理议题讨论较为少见, 特别是关于科学大数据跨领域、跨学科协同的复杂性问题,学术界鲜有系统性研 究过去人们对于科学大数据的理解局限于自然科学视域,人文社会科学视域下 的科学大数据逻辑没有得到应有的重视,而实际上,人文社会科学研究恰恰在 大数据吋代显示岀其新的生命力因此,如何从全新的视角系统厘清科学人数据 的基础科学问题,以指导科学大数据的应用实践,支持满足社会发展与国家安 全的重大需求,成为当前科学大数据研究的重要突破点鉴于此,本文主耍从数 据科学、信息管理、图书情报的角度出发,旨在探究并提出科学大数据的核心内 涵与数据价值链问题,形成兼具共识性的科学大数据理论与实践范式,以此推 动科学大数据的繁荣与发展。

2科学大数据的概念框架科学大数据的提出源丁大数据对科学知识发现与创新研究的深刻影响,其节点 是2012年美国总统奥巴马宣布启动“大数据研究与开发计划”从词语结构上 看,科学大数据是一个典型的复合词,学术界关于科学大数据的术语裁定是围 绕词根语素“大数据”之本身,强调“大数据”层面的范畴定性问题如诸云强 等宜学者将科学大数据被定义为与科学相关,反映和表征着复杂的自然和社会 科学现象与关系的大数据;黎建辉等学者认为科学大数据是通过“机器”自 动化快速采集、规模化存储与分析处理、具有较高维度和复杂关联的数据及其衍 牛产品实际上,随着不同类型科学研究的交叉与关联倾向不断加强,科学大数 据问题已经从单纯的大数据问题延伸为科学研究体系的大数据化问题换句话说, 科学大数据不仅仅來源于物理层面的科学数据,还涉及到社会空间、信息空间的 科学关联数据问题,也就是说,科学大数据的概念逻辑理应在内涵与外延层面 进一步拓展与延伸科学大数据是以数据科学为木位学科的专有术语,目前图书情报学科与数据科 学的相融愈加密切,基于该范畴岀发,本文认为,科学大数据有狭义与广义之 分:狭义的科学大数据是指科学实验、科学设计等科学研究领域产生的一系列原 始性、基础性数据,其本质上是以数据论(强调数据体量、类型与传播)为代表 的科学大数据集合;广义的科学大数据存在于科研活动与科学研究的整个生命周 期之中,包括科研启动、科硏合作、科研结果与成果利用过程中涉及到的科研人 员数据、科研资料数据、科研技术数据与科研环境数据等。

从广义视角来看,科 学大数据的概念范畴可分为两个结构维度,一是知识维度,即科学知识大数据, 包含各科学领域已形成的基本数据、资料、文献等承载知识内容的数据;二是活 动维度,即科学活动大数据,包括科学活动中的实体(如人员、机构、项目等) 及其关系数据(如合作、引证、共现、社交等)目前学术界对科学大数据的理 解主要着眼于知识维度层面的科学大数据集聚与融合问题,而对活动维度层面 的科学大数据实体关系识别与效用计量评估等问题关注较少实际上,走向大科 学(Big Science)范畴的科学大数据是以目标为导向的科学家合作、科学网络 形成与科学数据价值共创的系统工程,由此,科学大数据的外延将不断泛化,而内涵则固化到具体的科学问题与科学任务攻克,最终形成数据聚合、工具集成 与专家协同的科学大数据“网” O3科学大数据的范式建构剖析库恩将范式定义为针对科学革命的整体性框架与价值标准,包括定律、方法、技 术等凹科学大数据的提出与形成有其历史特殊性,图灵奖获得者Jim Gray 提出科学研究的第四范式,即数据密集型科学发现,科学大数据正是该范式下 的核心基点和载体面对科学硏究的特定问题,科学大数据范式在硏究途径、功 能、机制等方面表现出不同于其他范式的独特内涵和新兴解释力,这与其范式变 革与建构密切相关。

3.1范式共同体及其拓展科学共同体表征为科学家团体的群体集合,科学共同体是范式的主体,科学共 同体及其约定则是范式的载体巨1在大数据理念下,科学大数据分析与共享促 使从事科学研究与科学发现的科学共同体凝聚力与通约性更强,表现为人员更 庞大、交叉更明显、渗透更紧密等科学大数据工程的推进为科学共同体的科学 交流与科研产出提供便利,而科学共同体的合作与开放将为科学大数据工程的 迈进提供坚实基础从这个思维出发,科学大数据的科学共同体问题既解释了科 学大数据的广义概念逻辑,也从共同的理论模型和问题框架需求层面倒逼科学 大数据范式特体的形成与演进从研究范式來看,科学大数据的科学共同体包括计算机学家、数据科学家、图书 情报学家、档案学家、数据管理者等一系列为科学大数据资源的管理与服务起着 关键作用的相关集团由此,科学大数据的科学共同体学术团队或个体的学术关 联与衔接纽带成为科学大数据主体形态的合作网络,主体间性通过何种方式形 成科学大数据研究链则成为其关键;从实践范式考虑,科学大数据的战略推进与 实施、服务策略与方式、产品生产与应用等是由科学共同体、政府、民众等共同 作用的结果尤其是在大数据语境或环境下,科学研究与科学发现所依赖的科学 大数据范式特体已经逐步形成一个由科学共同体及其特定关联主体组成的有机 整体。

这样,脱离科学家“霸权”的科学大数据共同契约以及契约之间的相互联 结与作用将会促使原有的科学大数据范式共同体向由科学大数据导向的多元主 体向度延伸,届时各类主体参与科学知识创造与体制改进,共同为科技发展与 人类社会进步服务3.2科学大数据范式内容构成范式具有明显的结构性特。

下载提示
相似文档
正为您匹配相似的精品文档