大数据的前世今生:大数据特征与发展历程-修订编选

上传人:l****6 文档编号:149406300 上传时间:2020-10-26 格式:PDF 页数:6 大小:690.27KB
返回 下载 相关 举报
大数据的前世今生:大数据特征与发展历程-修订编选_第1页
第1页 / 共6页
大数据的前世今生:大数据特征与发展历程-修订编选_第2页
第2页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《大数据的前世今生:大数据特征与发展历程-修订编选》由会员分享,可在线阅读,更多相关《大数据的前世今生:大数据特征与发展历程-修订编选(6页珍藏版)》请在金锄头文库上搜索。

1、 中国大数据技术/应用/售前 交流圈 QQ 群:322914180 大数据的前世今生:大数据特征与发展历程大数据的前世今生:大数据特征与发展历程 大数据(big data)是这样的数据集合:数据量增长速度极快,用常规的 数据工具无法在一定的时间内进行采集、处理、存储和计算的数据集合。 大数据具有以下五大特征(五大特征(4V+1O4V+1O)的数据才称之为大数据)的数据才称之为大数据,即: 数据量大(数据量大(VolumeVolume)。)。第一个特征是数据量大,包括采集、存储和计算的 量都非常大。大数据的起始计量单位至少是 P(1000 个 T)、E(100 万个 T) 或 Z(10 亿个 T

2、)。 类型繁多(类型繁多(VarietyVariety)。)。第二个特征是种类和来源多样化。包括结构化、半 结构化和非结构化数据,具体表现为网络日志、音频、视频、图片、地理位置 信息等等,多类型的数据对数据的处理能力提出了更高的要求。 价值密度低(价值密度低(ValueValue)。)。第三个特征是数据价值密度相对较低,或者说是浪 里淘沙却又弥足珍贵。随着互联网以及物联网的广泛应用,信息感知无处不 在,信息海量,但价值密度较低,如何结合业务逻辑并通过强大的机器算法来 挖掘数据价值,是大数据时代最需要解决的问题。 速度快时效高(速度快时效高(VelocityVelocity)。)。第四个特征数据

3、增长速度快,处理速度也 快,时效性要求高。比如搜索引擎要求几分钟前的新闻能够被用户查询到,个 性化推荐算法尽可能要求实时完成推荐。这是大数据区别于传统数据挖掘的显 著特征。 中国大数据技术/应用/售前 交流圈 QQ 群:322914180 数据是在线的(数据是在线的(OnlineOnline)。)。数据是永远在线的,是随时能调用和计算的, 这是大数据区别于传统数据最大的特征。现在我们所谈到的大数据不仅仅是 大,更重要的是数据变的在线了,这是互联网高速发展背景下的特点。比如, 对于打车工具,客户的数据和出租司机数据都是实时在线的,这样的数据才有 意义。如果是放在磁盘中而且是离线的,这些数据远远不

4、如在线的商业价值 大。 关于大数据特征方面,特别要强调的一点是数据是在线的,因为很多人认 为数据量大就是大数据,往往忽略了大数据的在线特性。数据只有在线,即数 据在与产品用户或者客户产生连接的时候才有意义。如某用户在使用某互联网 应用时,其行为及时的传给数据使用方,数据使用方通过某种有效加工后(通 过数据分析或者数据挖掘进行加工),进行该应用的推送内容的优化,把用户 最想看到的内容推送给用户,也提升了用户的使用体验。 大数据发展过程的重大事件大数据发展过程的重大事件 20052005 年年 HadoopHadoop 项目诞生。项目诞生。 Hadoop 其最初只是雅虎公司用来解决网页搜索 问题的

5、一个项目,后来因其技术的高效性,被 Apache Software Foundation 公 司引入并成为开源应用。Hadoop 本身不是一个产品,而是由多个软件产品组成 的一个生态系统,这些软件产品共同实现全面功能和灵活的大数据分析。从技 术上看,Hadoop 由两项关键服务构成:采用 Hadoop 分布式文件系统(HDFS) 的可靠数据存储服务,以及利用一种叫做 MapReduce 技术的高性能并行数据处 理服务。这两项服务的共同目标是,提供一个使对结构化和复杂数据的快速、 可靠分析变为现实的基础。 20082008 年末,年末,“大数据大数据”得到部分美国知名计算机科学研究人员的认可得到

6、部分美国知名计算机科学研究人员的认可,业 界组织计算社区联盟 (Computing Community Consortium),发表了一份有影响 力的白皮书大数据计算:在商务、科学和社会领域创建革命性突破。它使 中国大数据技术/应用/售前 交流圈 QQ 群:322914180 人们的思维不仅局限于数据处理的机器,并提出:大数据真正重要的是新用途 和新见解,而非数据本身。此组织可以说是最早提出大数据概念的机构。 20092009 年印度政府建立了用于身份识别管理的生物识别数据库年印度政府建立了用于身份识别管理的生物识别数据库,联合国全球 脉冲项目已研究了对如何利用手机和社交网站的数据源来分析预测

7、从螺旋价格 到疾病爆发之类的问题。 20092009 年中,美国政府通过启动年中,美国政府通过启动 Data.govData.gov 网站的方式进一步开放了数据的网站的方式进一步开放了数据的 大门,大门,这个网站向公众提供各种各样的政府数据。该网站的超过 4.45 万量数据 集被用于保证一些网站和智能手机应用程序来跟踪从航班到产品召回再到特定 区域内失业率的信息,这一行动激发了从肯尼亚到英国范围内的政府们相继推 出类似举措。 20092009 年,欧洲一些领先的研究型图书馆和科技信息研究机构建立了伙伴关年,欧洲一些领先的研究型图书馆和科技信息研究机构建立了伙伴关 系致力于改善在互联网上获取科学

8、数据的简易性。系致力于改善在互联网上获取科学数据的简易性。 20102010 年年 2 2 月,肯尼斯月,肯尼斯库克尔在经济学人上发表了长达库克尔在经济学人上发表了长达 1 14 4 页的大数页的大数 据专题报告数据,无所不在的数据。据专题报告数据,无所不在的数据。库克尔在报告中提到:“世界上有着 无法想象的巨量数字信息,并以极快的速度增长。从经济界到科学界,从政府 部门到艺术领域,很多方面都已经感受到了这种巨量信息的影响。科学家和计 算机工程师已经为这个现象创造了一个新词汇:“大数据”。库克尔也因此成 为最早洞见大数据时代趋势的数据科学家之一。 20112011 年年 2 2 月,月,IBM

9、IBM 的沃森超级计算机每秒可扫描并分析的沃森超级计算机每秒可扫描并分析 4TB4TB(约(约 2 2 亿页文亿页文 字量)的数据量字量)的数据量,并在美国著名智力竞赛电视节目危险边缘“Jeopardy” 上击败两名人类选手而夺冠。后来纽约时报认为这一刻为一个“大数据计算的 胜利。” 20112011 年年 5 5 月,全球知名咨询公司麦肯锡月,全球知名咨询公司麦肯锡(McKinsey&Company)(McKinsey&Company)肯锡全球研究肯锡全球研究 院(院(MGIMGI)发布了一份报告)发布了一份报告大数据:创新、竞争和生产力的下一个新领大数据:创新、竞争和生产力的下一个新领 域

10、,大数据开始备受关注,域,大数据开始备受关注,这也是专业机构第一次全方面的介绍和展望大数 据。报告指出,大数据已经渗透到当今每一个行业和业务职能领域,成为重要 的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消 费者盈余浪潮的到来。报告还提到,“大数据”源于数据生产和收集的能力和 速度的大幅提升由于越来越多的人、设备和传感器通过数字网络连接起 来,产生、传送、分享和访问数据的能力也得到彻底变革。 20112011 年年 12 12 月,工信部发布的物联网十二五规划上,把信息处理技术作为月,工信部发布的物联网十二五规划上,把信息处理技术作为 4 4 项关键技术创新工程之一被提出

11、来项关键技术创新工程之一被提出来,其中包括了海量数据存储、数据挖掘、 图像视频智能分析,这都是大数据的重要组成部分。 20122012 年年 1 1 月份,瑞士达沃斯召开的世界经济论坛上,大数据是主题之一月份,瑞士达沃斯召开的世界经济论坛上,大数据是主题之一, 会上发布的报告大数据,大影响(Big Data, Big Impact) 宣称,数据已经 成为一种新的经济资产类别,就像货币或黄金一样。 中国大数据技术/应用/售前 交流圈 QQ 群:322914180 20122012 年年 3 3 月,美国奥巴马政府在白宫网站月,美国奥巴马政府在白宫网站发布了大数据研究和发展倡发布了大数据研究和发展

12、倡 议,议,这一倡议标志着大数据已经成为重要的时代特征。2012 年 3 月 22 日, 奥巴马政府宣布 2 亿美元投资大数据领域,是大数据技术从商业行为上升到国 家科技战略的分水岭,在次日的电话会议中,政府对数据的定义“未来的新石 油”,大数据技术领域的竞争,事关国家安全和未来。并表示,国家层面的竞 争力将部分体现为一国拥有数据的规模、活性以及解释、运用的能力;国家数 字主权体现对数据的占有和控制。数字主权将是继边防、海防、空防之后,另 一个大国博弈的空间。 20122012 年年 4 4 月,月,美国软件公司美国软件公司 SplunkSplunk 于于 1919 日在纳斯达克成功上市,成为

13、第日在纳斯达克成功上市,成为第 一家上市的大数据处理公司。一家上市的大数据处理公司。鉴于美国经济持续低靡、股市持续震荡的大背 景,Splunk 首日的突出交易表现尤其令人们印象深刻,首日即暴涨了一倍多。 Splunk 是一家领先的提供大数据监测和分析服务的软件提供商,成立于 2003 年。Splunk 成功上市促进了资本市场对大数据的关注,同时也促使 IT 厂商加 快大数据布局。 20122012 年年 7 7 月,联合国在纽约发布了一份关于大数月,联合国在纽约发布了一份关于大数据政务的白皮书,总结了据政务的白皮书,总结了 各国政府如何利用大数据更好地服务和保护人民各国政府如何利用大数据更好地

14、服务和保护人民。这份白皮书举例说明在一个 数据生态系统中,个人、公共部门和私人部门各自的角色、动机和需求:例如 通过对价格关注和更好服务的渴望,个人提供数据和众包信息,并对隐私和退 出权力提出需求;公共部门出于改善服务,提升效益的目的,提供了诸如统计 数据、设备信息,健康指标,及税务和消费信息等,并对隐私和退出权力提出 需求;私人部门出于提升客户认知和预测趋势目的,提供汇总数据、消费和使 用信息,并对敏感数据所有权和商业模式更加关注。白皮书还指出,人们如今 可以使用的极大丰富的数据资源,包括旧数据和新数据,来对社会人口进行前 所未有的实时分析。联合国还以爱尔兰和美国的社交网络活跃度增长可以作为

15、 失业率上升的早期征兆为例,表明政府如果能合理分析所掌握的数据资源,将 能“与数俱进”,快速应变。 20122012 年年 7 7 月,为挖掘大数据的价值,阿里巴巴集团在管理层设立月,为挖掘大数据的价值,阿里巴巴集团在管理层设立“首席数首席数 据官据官”一职,一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平 台“聚石塔”,为天猫、淘宝平台上的电商及电商服务商等提供数据云服 务。随后,阿里巴巴董事局主席马云在 2012 年网商大会上发表演讲,称从 2013 年 1 月 1 日起将转型重塑平台、金融和数据三大业务。马云强调:“假如 我们有一个数据预报台,就像为企业装上了一个 GPS

16、和雷达,你们出海将会更 有把握。”因此,阿里巴巴集团希望通过分享和挖掘海量数据,为国家和中小 企业提供价值。此举是国内企业最早把大数据提升到企业管理层高度的一次重 大里程碑。阿里巴巴也是最早提出通过数据进行企业数据化运营的企业。 20142014 年年 4 4 月,世界经济论坛以月,世界经济论坛以“大数据的回报与风险大数据的回报与风险”主题发布了全球主题发布了全球 信息技术报告(第信息技术报告(第 1313 版)。版)。报告认为,在未来几年中针对各种信息通信技术 的政策甚至会显得更加重要。在接下来将对数据保密和网络管制等议题展开积 极讨论。全球大数据产业的日趋活跃,技术演进和应用创新的加速发展,使各 国政府逐渐认识到大数据在推动经济发展、改善公共服务,增进人民福祉,乃 至保障国家安全方面的重大意义。 中国大数据技术/应用/售前 交流圈 QQ 群:322914180 20142014 年年 5 5 月,美国白宫发布了月,美国白宫发布了 20142014 年全球年全球“大数据大数据”白

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > 总结/计划/报告

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号