公共文化服务大数据的来源、采集与分析研究

上传人:小** 文档编号:34080843 上传时间:2018-02-20 格式:DOC 页数:7 大小:57KB
返回 下载 相关 举报
公共文化服务大数据的来源、采集与分析研究_第1页
第1页 / 共7页
公共文化服务大数据的来源、采集与分析研究_第2页
第2页 / 共7页
公共文化服务大数据的来源、采集与分析研究_第3页
第3页 / 共7页
公共文化服务大数据的来源、采集与分析研究_第4页
第4页 / 共7页
公共文化服务大数据的来源、采集与分析研究_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《公共文化服务大数据的来源、采集与分析研究》由会员分享,可在线阅读,更多相关《公共文化服务大数据的来源、采集与分析研究(7页珍藏版)》请在金锄头文库上搜索。

1、公共文化服务大数据的来源、采集与分析研究 嵇婷 吴政 南京图书馆 摘 要: 2015 年国务院关于加快构建现代公共文化服务体系的意见中提出了加快推进公共文化服务数字化建设与现代传播能力的要求,并明确提出加强公共文化大数据采集、存储和分析处理的意见。以公共图书馆、博物馆、文化馆、科技馆等为代表的公共文化服务机构,通过信息化系统与数字服务平台产生了包括业务数据、网络数据、管理数据在内的公共文化大数据。确定公共文化服务大数据的来源与采集方案,挖掘大数据在公共文化服务中的应用价值是十分值得研究的课题。关键词: 公共文化服务; 大数据来源; 大数据分析; 作者简介:嵇婷,女,1982 年生,现工作于南京

2、图书馆业务管理部,馆员。作者简介:吴政,男,1963 年生,南京图书馆业务管理部主任,研究馆员。收稿日期:2015-07-13基金:全国文化信息资源共享工程“十三五”发展规划重点方向研究课题“公共文化服务大数据的采集与分析研究”阶段性成果之一;项目编号:WHGXFZGH-2015-0303Research on Resource, Acquisition and Analysis of Big Data of Public Cultural ServiceAbstract: In 2015, the document Opinions on Accelerating the Construct

3、ion of a Modern Public Cultural Service System issued by the State Council illustrates the claim to accelerate the ability of digital construction and modern communication of public cultural service, and clearly puts forward opinrions on reinforcing big data acquisition, storage and analysis of publ

4、ic cultural service. Public libraries, museums, cultural centers, science and technology center and other public cultural service institutions get public culture big datas including work data, network data and management data via information system and digital service. It is worth to study on making

5、 clear the resource and acquisition scheme, and mining the application value of big data in the public cultural service.Keyword: Public cultural service; Big data resource; Big data analysis; Received: 2015-07-131 引言1.1 大数据的概念与理解2012 年,纽约时报称“大数据”时代已经来临,庞大的数据资源使得各个领域开始了量化进程,并带来了人类“生活、工作与思维的大变革”1。大数据目

6、前没有统一的定义,维基百科从数据处理的角度将大数据定义为“难以用现有的数据库管理工具处理的兼具海量特征和复杂性特征的数据集成”2。麦肯锡咨询报告将 TB 级以上的数据集视为大数据,而舍恩伯格在大数据时代:生活、工作与思维的大变革一书中认为 PB 以上的数据才能被称为大数据1。大数据具有公认的“3v”特征数据量大(volume)、类型多(variety)、速度快(velocity),在这之后,越来越多的人提出更多的“v”来补充大数据的特征,如价值密度低(value)、真实性高(veracity)等。当前,相关学者提出了大数据的又一个重要特征:在线(online)指大数据是在线的、随时能调用和计算

7、的“活的数据”3。数据只有共享、与其他数据产生连接才有意义和价值。因此,大数据不等于“数据大”,“数据大”可能是堆砌的“数据孤岛”,是未被激活的数据;故而,也有专家认为,数量达到 TB 级或 PB 级不是大数据的必要条件4。大数据的来源包括三个方面:一是人类活动,即由人直接产生,如电子商务、通讯通信、银行交易、社交网络中的数据。二是物理世界,即物理信息数字化后产生的数据,如传感节点采集的数据、PM2.5 数据、视频监控数据等。三是数据本身,如在数据的存储、加工过程中,对数据的压缩、规则适用、智能衍生等自动产生的数据4。1.2 公共文化服务机构及信息化概况2015 年,国务院关于加快构建现代公共

8、文化服务体系的意见中明确提出“加快推进公共文化服务数字化建设与现代传播能力”和“加强公共文化大数据采集、存储和分析处理”的要求5。“公共文化大数据的采集与分析”作为重点课题,被国家文化部列为制定公共文化“十三五”规划的重要参考依据。公共文化服务是指以政府部门为主导的公共部门提供的以保障公民的基本文化权益为目的、向公民提供公共文化产品与服务的制度和系统的总称6。我国公共文化服务的机构和场所主要有图书馆、博物馆、美术馆、纪念馆、非物质文化遗产馆、科技馆、群艺馆、文化馆(站、室)、文物保护单位等。这些机构在服务运营中,通过信息化系统不断产生数据。公共图书馆目前信息化程度较高,对于新技术的应用相对比较

9、及时。图书馆在20 世纪九十年代就已经实现了业务管理自动化,并自建、购买各类数字资源,提供多种信息服务平台,将读者服务延伸至计算机、手持阅读器、电子触摸屏、数字电视、平板电脑、手机等多种服务终端,形成了数字图书馆服务体系。此外,图书馆还建立了一系列面向管理的信息化系统,包括自动化办公、项目管理、人流量监控、舆情监测等,保障了图书馆的高效运行。博物馆、美术馆、纪念馆、非物质文化遗产馆、科技馆是收藏、保护和展示人类活动与自然环境的公众服务机构7,信息化建设已经成为该类型机构发展不可或缺的内容。电子导览讲解系统、网络展览展示系统、网上数字服务平台等向公众提供多形态的展览服务。藏品管理系统、票务管理系

10、统、观众分流和指挥调度系统、观众租用设备管理系统、自动化办公系统等实现了各机构的信息化管理。群众艺术馆、文化中心、文化馆(站)主要负责组织开展各类文艺活动,举办培训、展览、公益性讲座等。这类文化机构信息化水平落后于图书馆和博物馆。目前,数字文化馆的建立打破了传统服务的概念,基于互联网平台为群众提供数字文化产品与服务,拓展了文化馆的服务空间。此外,文化共享工程汇聚了图书馆、文化馆、博物馆、非物质文化遗产馆等所有公共文化系统的大中型、普及型和实用型数字资源,通过国家、省、市、县(区)、乡(街道)五级网络,传输到全国各地。数字图书馆推广工程搭建以各级公共图书馆为节点的数字图书馆虚拟网,建设了海量分布

11、式数字资源库群以及全国性的图书馆业务工作与服务的数字平台。公共电子阅览室建设依托共享工程网络,面向基层,为广大群众提供公共数字服务8。2 公共文化服务大数据的类别2.1 按不同服务系统区分按机构类型与服务系统的不同,公共文化服务大数据可分为:图书馆大数据、博物馆大数据、文化馆大数据、科技馆大数据、美术馆大数据、文化共享工程大数据等。2.2 按服务平台区分按服务平台的不同,公共文化服务大数据可分为:传统服务大数据及数字文化服务大数据。传统服务大数据是指在传统服务中所产生的大数据,主要来源于传统服务的业务系统与信息系统,也包括关于机构基本情况与其他相关统计数据。数字文化服务大数据特指在数字服务中所

12、产生的大数据,如公共文化服务网站、数字图书馆、数字体验产品、微博等平台所产生的数据。2.3 按信息类型区分按信息类型区分,公共文化服务大数据可分为:资源数据、用户数据、运行服务数据和用户行为数据。其中,资源与用户数据是基础,当两者发生服务或使用关系时,产生运行服务数据与用户行为数据。资源数据包括机构设施基本数据,以及各类实体资源、数字资源和服务资源的数据。用户数据是指性别、年龄、学历、地区等反映用户基本特征的数据。运行服务数据指各类软硬件资源在服务时所产生的数据,如机构服务时间与服务人次、图书流通情况、各类培训和展览的开展情况等。用户行为数据指用户在接受服务时各种行为所产生的数据,如用户图书借

13、阅、活动参与的数据,访问数字资源的行为数据等。2.4 按数据结构区分按数据结构区分,所有行业的大数据都可以分为结构化数据、半结构化数据、非结构化数据。结构化数据是指可以用二维表结构来逻辑表达实现的数据,如关系型数据库。非结构化数据指像全文文本、各类报表、图像、声音、影视、超媒体等不方便用数据库二维逻辑表来表现的数据。半结构化数据就是介于结构化数据和非结构化数据之间的数据,如 H T M L 文档数据。3 公共文化服务大数据的来源研究公共文化服务大数据来源于机构信息化系统与数字服务平台,主要包括业务数据、网络数据、管理数据。3.1 业务数据业务数据是机构内部与业务相关的信息系统所产生的数据,包括

14、:(1)面向业务操作与流程的业务系统数据,如博物馆藏品管理系统、图书馆信息自动化系统等所产生的数据。藏品管理系统记录了每个藏品的基本信息、位置信息、参展情况、专家鉴定信息等,是业务分析的第一手数据,数据量庞大。这些数据还可以发挥更高的数据价值,如将藏品信息网络化,融合物联网技术走出信息孤岛。(2)面向用户的系统所产生的数据,如科技馆、博物馆的网络展览展示系统所产生的数据;公共文化服务机、大屏读报系统数据,等等。(3)来自公共文化服务的数据集市或数据仓库的统计或明细数据。例如,图书馆馆情数据统计系统采集了区域内所有公共图书馆的硬件设备、经费使用、人员情况、服务资源等指标数据,汇集了分散的数据源,

15、形成区域性的数据中心。3.2 网络数据网络数据是公共文化服务机构互联网服务平台所产生的数据,来源于电脑、手机、数字机顶盒、阅读器、触摸大屏等终端设备,包括了如官方网站、共享工程网站、数字图书馆(博物馆、文化馆)、移动图书馆(博物馆、文化馆)、官方微博微信平台、馆际互借平台、参考咨询平台、政府公开信息服务平台、公共电子阅览室平台等公共文化网络服务平台产生的所有数据。其中,共享工程、数字图书馆(博物馆、文化馆)数据量庞大,包含了各类商业数据库、自建数据库的使用数据,数据形式也比较复杂。3.3 管理数据管理数据是维护文化服务机构正常运营的各种管理信息系统所产生的数据。财务系统、自动化办公系统产生的数

16、据由于是孤岛信息,难以与其他数据发生关联,因此较难进行大数据应用。人流量分析系统能记录文化服务场所庞大的客流量信息,并能够利用视频分析技术、红外技术、门禁刷卡等技术分析场所内具体位置(如阅览室、展厅)的人流量甚至停留时间,是十分具有价值的数据源。此外,如博物馆商店系统、设备租借管理系统等记录了用户文化消费行为,也可用作大数据分析。除上述三类数据外,还有一部分大数据来源于公共文化机构外部,如帖子、微博、微信等自媒体数据以及与公共文化服务相关的网站数据、市场文化服务数据。例如,用户在网络中对文化机构的舆论点评数据,都是可分析研究的大数据。需要注意的是,由于外部数据的所有权掌握在网站企业手中,因此其在实际应用中存在一定难度。4 大数据采集与存储技术方案4.1 数据接口数据来源于不同的数字化服务平台,因此,对于不同的系统需研究不同的接口与采集方式:对于直接开放数据库接口的平台采用数据库直接采集的方式;对于开放程序接口的平台利用其 API 进行数据获取;对于无开放接口的平台则需进行网

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 管理论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号