大数据时代档案馆:基于swot分析

上传人:第*** 文档编号:55930392 上传时间:2018-10-08 格式:DOCX 页数:12 大小:46.82KB
返回 下载 相关 举报
大数据时代档案馆:基于swot分析_第1页
第1页 / 共12页
大数据时代档案馆:基于swot分析_第2页
第2页 / 共12页
大数据时代档案馆:基于swot分析_第3页
第3页 / 共12页
大数据时代档案馆:基于swot分析_第4页
第4页 / 共12页
大数据时代档案馆:基于swot分析_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《大数据时代档案馆:基于swot分析》由会员分享,可在线阅读,更多相关《大数据时代档案馆:基于swot分析(12页珍藏版)》请在金锄头文库上搜索。

1、大数据时代的档案馆:基于 SWOT 的分析 周 枫 (上海大学图书情报档案系 上海 200444) 摘 要 文章在对大数据的特征及内涵进行介绍的基础上,运用 SWOT 分析法对大数据时代我国档案馆事业发展的内部要素和外部环境进 行全面探究,总结优势和机遇,剖析劣势与威胁,并在此基础上运 用 SWOT 策略模型提出目前适合档案馆发展并提高其竞争力的策略与 建议。 关键词 档案馆 大数据 SWOT 分析The archives in big data era: based on the SWOT analysis Zhou Feng (Department of Library,Informati

2、on and Archives,Shanghai University, Shanghai, 200444)Abstract:Based on the introduction of characteristics and connotation of big data, the paper explores the internal factors and external environment of archives cause in China with the SWOT analysis method in big data era, summarizing the advantag

3、es and opportunities, analyzing the weaknesses and threats. And then, it put forward several appropriate strategies for the development of archives by using SWOT strategy model.Keywords:Archives; Big Data; SWOT analysis大数据是继 web2.0、云计算、物联网之后近两年最为炙热的一 个词汇,也引发了信息科技领域越来越多的关注与投身热潮。2011 年,麦肯锡在研究报告大数据:下一个

4、创新、竞争和生产率前沿1中首次提出“大数据”的概念,之后纽约时报2、 华尔街日报3等都对大数据进行了专栏介绍。随着 2012 年奥巴马政府宣布 投资两亿美元启动“大数据研究与发展计划”4,大数据正式上升 为与历史上的互联网、超级计算同等重要的国家战略。 “这是一次革 命” ,哈佛量化社会科学研究所主任 Gary King 说:“我们的确正在 起航,在庞大的新数据来源的支持下,量化的前进步伐将会踏遍学 术、商业和政府领域,没有一个领域可以不被触及。 ”5档案馆也不 例外,从上古的结绳记事到如今源源不断的信息流,大数据时代的 到来,也给档案馆带来了极大的冲击。档案馆必须利用一切有效手 段来分析现状

5、与未来,做出正确的选择。1 何为大数据 截至目前,大数据并没有形成一个统一的定义,然而,通过分析 不同概念发现,尽管描述不一,但却存在着一个共识:大数据不是 对数据量大小的定量描述,而是一种在种类繁多、数量庞大的多样 数据中进行的快速信息获取。6 1.1 大数据的特征 数据其实一直都在,那么又何以成为大数据呢?这主要是由大数 据的 4V 特征决定的: 1.1.1 大量(Volume) 大数据中的数据不再以几个 GB 或几个 TB 来 衡量,而是以 PB(1 千个 T) 、EB(1 百万个 T)或 ZB(10 亿个 T) 为计量单位。IDC2011 年 6 月报告显示,全球数据量在 2011 年

6、已达 到 1.8ZB, “如果把所有这些数据都刻录存入普通 DVD 光盘里,光盘 的高度将等同于从地球到月球一个半来回,也就是 720 000 英里。 相当于每位美国人每分钟写 3 条 Twitter,而且还要不停地写 2.6976 万年” ,此外,IDC 还预测“全球数据量大约每两年翻一番, 2015 年全球数据量将达到近 8ZB,到 2020 年,全球将达到 35ZB” 。71.1.2 速度(Velocity) 首先,大数据往往以高速实时数据流的形 式动态产生,具有很强的时效性。2010 年,据英国研究咨询公司 Coda 预测,移动网络数据流量在未来五年有望增长 40 倍,用户上 传的内容

7、将爆发式增长。其次,对大数据的处理速度要非常快。传 统数据仓库系统、BI 应用都是批处理方式,但对于大数据应用,必 须进行实时数据流处理。比如对于灾难的预测,需要很快地对发生 的程度、影响的区域范围等进行量化。 1.1.3 多样(Variety) 一是数据来源多,随着科技的发展,大数 据数据来源和承载方式多种多样,如微博、社交网站、传感器等, 数据处于分散状态。二是数据类型多,包括结构化数据(如企业、 行业内数据) 、半结构化数据(物联网数据) 、非结构化数据(互联 网数据) ,并且据 Gartner 预计,2012 年“半结构和非结构化的数 据,诸如文档、表格、网页、音频、图像和视频等将占全

8、球网络数 据量的 85%左右”8。 1.1.4 价值(Value) 由于大量有用与可能没用的数据并存,因此 大数据可谓是“遍地都是金子,又遍地都是沙子” 。一方面,大数据的价值密度较低,以视频监控为例,在连续不断的监控流中,可能 仅有一两秒的影像是有用的数据。另一方面,虽然单条数据并无多 大价值,但庞大的数据量则是一座“富矿” ,将已有的结构化与非结 构化数据进行融合、分析后,将会从中挖掘出极高的价值。 1.2 大数据的认识拓展 作为一个新兴理念与技术,大数据吸引了业界的大量眼球,让我 们惊呼大数据时代的到来。然而,大数据远非如其名称般简单,目 前仍有很多人对其认识与理解存在偏差。基于此种现状

9、,笔者觉得 有必要对相关模糊问题进行阐释。 1.2.1 大数据一定很大? 在大数据的认识上,很多人存在这么一个 误区:只有几百 TB 乃至 PB 的数据才能称之为大数据。事实上, “大 数据并非总是说有数百个 TB 才算得上,根据实际使用情况,有时候 数百个 GB 的数据也可称为大数据,这主要看它的第三个维度,也就 是速度或时间维度”9。因而可以说,大数据不是对数据量大小的 定量描述,而是在信息爆炸时代如何快速地对数据价值进行深层挖 掘。 1.2.2 大数据越多越好? 既然是对数据进行深入挖掘,那么是不是 数据量越多越好?事实上,解决一个问题的数据规模有一个阈值。 “数据少于这个阈值,问题解决

10、不了;达到这个阈值,就可以解决 以前解决不了的大问题;而数据规模超过这个阈值,对解决问题也 没有更多的帮助” 。10因此,当我们在做数据分析时,我们的任务 不是去获取越来越多的数据,而是对数据去冗分类、去粗取精,把 大数据做成小数据,只有这样,我们才能在数据之间游刃有余。 1.2.3 大数据主要是一种技术变革? 本质而言,大数据是信息爆炸 时代对数据核心价值的再挖掘,其中综合运用到去冗降噪技术、语 义引擎、可视化分析等,因此被很多专业人士认为是继云计算、物 联网之后 IT 行业的又一次颠覆性变革。事实上,大数据“不仅仅是 技术变革,更实质上的是计算机服务时代的来临,对数据的抽丝剥 茧、总结结论

11、更体现了计算机行业正从技术供应型转为服务供应”11。2 档案馆应用大数据的 SWOT 分析 SWOT 分析法即态势分析法,其思路是在分析与研究对象密切相关的内部优势(Strengths) 、劣势(Weaknesses)及外部机会 (Opportunities) 、威胁(Threats)的基础上,构建 SWOT 分析矩 阵,得出相应的结论,并制定发展战略及对策。运用 SWOT 分析法对 档案馆在大数据时代的发展进行分析,有利于档案馆认清内外部形 势,明确发展方向,从而制定科学的发展规划。 2.1 优势(Strength)分析 2.1.1 资源优势 对档案馆而言,其最大的优势在于档案馆所拥有的 资

12、源。首先,档案馆的信息资源总量庞大且增长迅速。2008 年,全 国各级国家档案馆共保存档案 1.93 亿卷,较上年增加 1769 万卷, 增幅达 10%12,而到 2011 年,各级国家档案馆馆藏已达 3.3 亿卷, 到 2020 年,各级国家档案馆馆藏将达到 6 亿多卷13。其次,档案 馆的数据资源种类繁多。在档案馆的数据资源中,既有数字化的纸 质档案、接收进馆的电子文件、音视频数据库等,也有用户利用信 息、服务数据等数据资源,这些数据的格式、特征等形式多样,而 各馆之间更是差异明显,从而形成了大量的异构数据。再次,档案 馆的数据资源价值很高。作为国家和社会精心保存的历史记录,毫 无疑问,档

13、案这种数据资源具有很高的价值。与图书、网络资源等 数据资源相比, “档案是一种最真实、最可靠、最具权威性与凭证性 的原生信息资源”14,这就使得数据洪流时代档案的价值与作用更 加凸显,也必将使之在大数据时代占据重要地位。因此,随着档案 馆资源体系建设步伐的加快及用户服务要求的提高,档案馆在大数 据时代已经具有了一定的大数据特征。 2.1.2 行业领先 首先,各级国家档案馆是集中统一保管党和国家档 案的科学文化事业机构,是永久保管档案的基地,是社会各界利用 档案史料的中心。因此,作为一种机构性存在与制度性安排,国家 档案馆的公益性、服务性、公平性、永久性等特征,使得档案馆成 为人们心目中最系统、

14、最可信赖的数据资源库。大数据时代,档案 馆维护和传承记忆的功能将更加重要,构建一个“基于互联网的, 以档案数字资源为主体,以文本、图片、音频、视频等为形式,为 中华民族集体记忆的建构和传承提供文献支撑的中国记忆数字 资源库”15将成为我们新的目标与使命。其次,档案馆在数据处理 上具有丰富的经验。大数据浪潮汹涌来袭,绝大部分行业与部门仍 处于起步阶段,而档案馆有可能在大数据时代引领潮流。考察数据生命周期,涉及到数据生成、数据采集、数据传输、数据处理、数 据分析、数据应用等阶段,而这也恰恰是档案馆熟悉的业务范畴, 因此档案馆可以通过模拟或借鉴传统档案处理的整套业务规范或流 程来指导大数据的处理,档

15、案馆“对知识规范性控制的思想和技术 方法恰巧在大数据领域有了用武之地”16。 2.2 劣势(Weaknesses)分析 2.2.1 认识问题 作为一个档案大国,几千年档案工作的历史积淀在 我国形成了丰富多彩的档案文化,也形成了一套独特的档案思维模 式。大数据时代的到来,则强烈地冲击着人们对档案及档案馆工作 根深蒂固的认识。以档案收集为例,长期以来,我国档案馆的收集 工作都是以接收为主,征集为辅。近年来,随着国家提出建立覆盖 人民群众的档案资源体系,档案馆开始收集一部分体制外档案资源 来丰富馆藏,然而总的而言,我国的档案收集工作仍处于一种被动 状态。大数据时代的到来,则要求人们突破以往收集工作认

16、识的桎 梏,主动收集各种反映国家、社会及公民个人记忆的信息,而无论 其内容、来源、形式如何。对于档案馆工作人员而言,则有可能出 现两种认识问题:一是没有大数据意识,即无视大数据时代的来临, 依然循守以前档案收集工作的老路;二是泛大数据化,即不加鉴别, 从而使档案馆陷入数据沼泽,显然这也是档案馆无法承受的。因此, 大数据背景下,科学认识大数据的内涵,合理地选择切入点,将是 档案馆在大数据时代立足的首要问题。 2.2.2 数据异构 大数据时代,数据的价值从何而来?涂子沛认为, 海量是基础,整合是关键。传统环境下,我国档案馆也面临着数据 异构的问题,然而,大数据背景下,档案馆的数据异构呈现出新的 特点,即在数据类型上由结构化数据为主转向结构化、半结构化及 非结构化数据的三者融合,数据产生与利用方式上由服务器个人电 脑等固定终端转向手机、平板电脑、传感器等移动终端,数据存储 方式上由存储在关系型数据库转为分布式存储(如 HDFS) 。这些变 化有可能导致数据膨胀、结构紊乱,从而使档案馆在未来的数据管

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号