第2章-云计算与大数据的相关技术(楷体)54

上传人:种**** 文档编号:260546193 上传时间:2022-02-28 格式:PPTX 页数:56 大小:799KB
返回 下载 相关 举报
第2章-云计算与大数据的相关技术(楷体)54_第1页
第1页 / 共56页
第2章-云计算与大数据的相关技术(楷体)54_第2页
第2页 / 共56页
第2章-云计算与大数据的相关技术(楷体)54_第3页
第3页 / 共56页
第2章-云计算与大数据的相关技术(楷体)54_第4页
第4页 / 共56页
第2章-云计算与大数据的相关技术(楷体)54_第5页
第5页 / 共56页
亲,该文档总共56页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《第2章-云计算与大数据的相关技术(楷体)54》由会员分享,可在线阅读,更多相关《第2章-云计算与大数据的相关技术(楷体)54(56页珍藏版)》请在金锄头文库上搜索。

1、云计算与大数据技术云计算与大数据技术 人民邮电出版社王鹏 黄焱 安俊秀 张逸琴 编著 目 录 CONTENTSp第1章 云计算与大数据基础 p第2章 云计算与大数据的相关技术 p第3章 虚拟化技术 p第4章 集群系统基础 p第5章 MPI面向计算p第6章 Hadoop分布式大数据系统p第7章 HPCC面向数据的高性能计算集群系统 p第8章 Storm基于拓扑的流数据实时计算系统p第9章 服务器与数据中心 p第10章 云计算大数据仿真技术第第2 2章云计算与大数据的相关技术章云计算与大数据的相关技术 云计算与大数据技术 第2章 云计算与大数据的相关技术 p2.1云计算与大数据p2.2云计算与物联

2、网p2.3一致性哈希算法2.3.1一致性哈希算法的基本原理2.3.2 一致性哈希算法中计算和存储位置的一致性p2.4非关系型数据库2.4.1从关系型数据库到非关系型数据库2.4.2非关系型数据库的定义2.4.3非关系型数据库的分类p2.5集群高速通信标准InfiniBandp2.6云计算大数据集群的自组织特性2.1云计算与大数据p2.1云计算与大数据p云计算与大数据相比云计算更像是对一种新的技术模式的描述而不是对某一项技术的描述,而大数据则较为确切地与一些具体的技术相关联。目前新出现的一些技术如Hadoop、HPCC、Storm都较为确切地与大数据相关,同时并行计算技术、分布式存储技术、数据挖

3、掘技术这些传统的计算机学科在大数据条件下又再次萌发出生机,并在大数据时代找到了新的研究内容。大数据其实是对面向数据计算技术中对数据量的一个形象描述,通常也可以被称为海量数据。云计算整合的资源主要是计算和存储资源,云计算技术的发展也清晰地呈现出两大主题计算和数据。伴随这两大主题,出现了云计算和大数据这两个热门概念,任何概念的出现都不是偶然的,取决于当时的技术发展状况。李国杰院士认为:“信息系统需要从数据围绕着处理器转改为处理能力围绕着数据转,将计算用于数据,而不是将数据用于计算”。2.1云计算与大数据海量的数据本身很难直接使用,只有通过处理的数据才能真正地成为有用的数据,因此云计算时代计算和数据

4、两大主题可以进一步明确为数据数据和针对数据的计算针对数据的计算,计算可以使海量的数据成为有用的信息,进而处理成为知识。目前提到云计算时,有时将云存储作为单独的一项技术来对待,只是把网络化的存储笼统地称为云存储,事实上在面向数据的时代不管是出现了云计算的概念还是大数据的概念,存储都不是一个独立存在的系统。特别是在集群条件下,计算和存储都是分布分布式式的,如何让计算如何让计算“找找”到自己需要处理的数据到自己需要处理的数据是云计算系统需要具有的核心功能核心功能。2.1云计算与大数据面向数据要求计算是面向数据的,那么数据的存储方式将会深刻地影响计算实现的方式。在分布式系统中实现实现计算和数据有效融合

5、从而提高数据处理能力,简化分布式程序设计难度,降低系统网络通信压力从而使系统能有效地面对大数据处理的机制称为计算和数据的协作机制计算和数据的协作机制。在这种协作机制中计算如何找到数据并启动分布式处理任务计算如何找到数据并启动分布式处理任务的问题是需要重点研究的课题,这一问题被称为计算和数据的位置一计算和数据的位置一致性致性问题。2.1云计算与大数据面向数据也可以更准确地称为“面向数据的计算面向数据的计算”,面向数据要求系统的设计和架构是围绕数据为核心围绕数据为核心展开的,面向数据也是云计算系统的一个基本特征,而计算与数据的有效协作计算与数据的有效协作是面向数据的核心要求核心要求。回顾计算机技术

6、的发展历程,可以清晰地看到计算机技术从面向计算逐步转变到面向数据的过程。从面向计算到面向数据是技术发展的必然趋势,并不能把云计算的出现归功于任何的个人和企业。这一过程的描述如图2.1所示,该图从硬件、网络和云计算的演进过程等方面以时间为顺序进行了纵向和横向的对比。2.1云计算与大数据在计算机技术的早期由于硬件设备体积庞大,价格昂贵,这一阶段数据的产生还是“个别”人的工作。这个时期的数据生产者主要是科学家或军事部门,他们更关注计算机的计算能力,计算能力的高低决定了研究能力和一个国家军事能力的高低。图2.1计算机技术向云计算的演进1969年ARPANET的出现改变了整个计算机技术的发展历史,网络逐

7、步成为推动技术发展的一个重要力量,1989年Tim Berners-Lee发明的万维网改变了信息的交流方式,特别是高速移动通信网络技术的发展和成熟使现在数据的生产成为全球人的共同活动,人们生产数据不再是在固定时间和固定地点进行,而是随时随地都在产生数据。微博、博客、社交网、视频共享网站、即时通信等媒介随时都在生产着数据并被融入全球网络中。相对而言由于这时数据量很小,数据在整个计算系统中的重要性并不突出。这时网络还没有出现,推动计算技术发展的主要动力是硬件的发展,这个时期是硬件的高速变革时期,硬件从电子管迅速发展到大规模集成电路。从云计算之父John McCarthy提出云计算的概念到大数据之父

8、Gray等人提出科学研究的第四范式,时间已经跨越了半个世纪。以硬件为核心的时代也是面向计算的时代,那时数据的构成非常简单,数据之间基本没有关联性,物理学家只处理物理实验数据,生物学家只处理生物学数据,计算和数据之间的对应关系是非常简单和直接,这个时期研究计算和存储的协作机制并没有太大的实用价值。到了以网络为核心的时代数据的构成变得非常复杂,数据来源多样化,不同数据之间存在大量的隐含关联性,这时计算所面对的数据变得非常复杂,如社会感知、微关系等应用将数据和复杂的人类社会运行相关联,由于人人都是数据的生产者,人们之间的社会关系和结构就被隐含到了所产生的数据之中。数据的产生目前呈现出了:大众化、自动

9、化、连续化、复杂化的趋势。云计算、大数据概念正是在这样的一个背景下出现的。这一时期的典型特征就是计算必须面向数据,数据是架构整个系统的核心要素,这就使计算和存储的协作机制研究成为需要重点关注的核心技术,计算能有效找到自己需要处理的数据,可以使系统能更高效地完成海量数据的处理和分析。 云计算和大数据这两个名词也可看作是描述了面向计算时代信息技术的两个方面,云计算侧重于描述资源和应用的网络化交付方法,大数据侧重于描述面向数据时代由于数据量巨大所带来的技术挑战。信息技术领域提出的面向数据的概念同时也开始深刻地改变了科学研究的模式,2007年著名的数据库专家Gray提出了科学研究的第四范式。他认为利用

10、海量的数据可以为科学研究和知识发现提供除经验、理论、计算外的第四种重要方法。科学研究的四个范式的发展历程也同样反映了从面向计算走向面向数据的过程。 2.1云计算与大数据如图2.2所示,人类早期知识的发现主要依赖于经验、观察和实验经验、观察和实验,需要的计算和产生的数据都是很少的。人类在这一时期对于宇宙的认识都是这样形成的,就像伽利略为了证明自由落体定理,是通过在比萨斜塔扔下两个大小不一的小球一样,人类在那个时代知识的获取方式是原始而朴素的。图图2.22.2科学研究四个范式的发展历程科学研究四个范式的发展历程当人类知识积累到一定的程度后,知识逐渐形成了理论体系,如牛顿力学体系、Maxwell的电

11、磁场理论,人类可以利用这些理论体系去预测自然并获取新的知识,这时对计算和数据的需求已经在萌生,人类已可以依赖这些理论发现新的行星,如海王星、冥王星的发现不是通过观测而是通过计算得到。 计算机的出现为人类发现新的知识提供了重要的工具。这个时代正好对应于面向计算的时代,可以在某些具有完善理论体系领域利用计算机仿真计算来进行研究。这时计算机的作用主要是计算,例如人类利用仿真计算可以实现模拟核爆这样的复杂计算。 现在人类在一年内所产生的数据可能已经超过人类过去几千年产生的数据的总和,即使是复杂度为的数据处理方法在面对庞大的时都显得力不从心,人类逐步进入面向数据的时代。第四范式说明可以利用海量数据加上高

12、速计算发现新的知识,计算和数据的关系在面向数据时代变得十分紧密,也使计算和数据的协作问题面临巨大的技术挑战。2.1云计算与大数据2.2云计算与物联网p2.2云计算与物联网云计算和物联网在出现的时间上非常接近,以至于有一段时间云计算和物联网两个名词总是同时出现在各类媒体上。物联网的出现部分得益于网络的发展,大量传感器数据的收集需要良好的网络环境,特别是部分图像数据的传输更是对网络的性能有较高的要求。在物联网技术中传感器的大量使用使数据的生产实现自动化,数据生产的自动化也是推动当前大数据技术发展的动力之一。物联网的英文名称为“The Internet of ThingsThe Internet o

13、f Things”,简称:IOTIOT。物联网就是“物物相连的互联网”。这有两层意思:l第一,物联网的核心和基础仍然是互联网,是在互联网基础之上的延伸和扩展的一种网络;l第二,其用户端延伸和扩展到了任何物品与物品之间,进行信息交换和通信。2.2云计算与物联网因此,物联网物联网的定义是通过通过射频识别(RFID)装置、红外感应器、全球定位系统、激光扫描器等信息传感设备信息传感设备,按约定的协议,把任何物品与互联网相连接,进行信息交换信息交换和通信通信,以实现智智能化识别能化识别、定位定位、跟踪跟踪、监控监控和管理管理的一种网络网络。明确的物联网概念最早是由美国麻省理工大学Auto-IDAuto-

14、ID实验室实验室在1999年提出的,最初是为了提高基于互联网流通领域信息化水平而设计的。物联网这个概念可以认为对一类应用的称呼,物联网与云计算技术的关系从定义上讲是应用与平台的关系。2.2云计算与物联网物联网系统需要大量的存储资源来保存数据,同时也需要计算资源来处理和分析数据,当前我们所指的物联网传感器连接呈现出以下的特物联网传感器连接呈现出以下的特点点:l连接传感器种类多样;l连接的传感器数量众多;l连接的传感器地域广大。这些特点都会导致物联网系统会在运行过程中产生大量的数据,物联网的出现使数据的产生实现自动化,大量的传感器数据不断地在各个监控点产生,特别是现在信息采样的空间密度和时间密度不

15、断增加,视频信息的大量使用,这些因素也是目前导致大数据概念出现的原因之一。 2.2云计算与物联网物联网的产业链产业链可以细分为标识标识、感知感知、处理处理和信息传送信息传送4个环节,每个环节的关键技术关键技术分别为RFIDRFID、传感器传感器、智能芯片智能芯片和电信运营商的无线传输网络无线传输网络。云计算的出现使物联网在互联网基础之上延伸和发展成为可能。l物联网中的物,在云计算模式中,它相当于是带上传感器的云终端,与上网本、手机等终端功能相同。l这也是物联网在云计算日渐成熟的今天,才能重新被激活的原因之一。2.2云计算与物联网p新的平台必定造就新的物联网,把云计算的特点与物联网的实际相结合,

16、云计算技术将给物联网带来以下深刻变革:(1)解决服务器节点的不可靠性问题,最大限度降低服务器的出解决服务器节点的不可靠性问题,最大限度降低服务器的出错率。错率。l近年来,随着物联网从局域网走向城域网,其感知信息也呈指数型增长,同时导致服务器端的服务器数目呈线性增长。l服务器数目多了,节点出错的概率肯定也随之变大,更何况服务器并不便宜。l节点不可信问题使得一般的中小型公司要想独自撑起一片属于自己的天空,那是难上加难。l而在云计算模式中,因为“云”有成千上万、甚至上百万台服务器,即使同时宕掉几台,“云”中的服务器也可以在很短的时间内,利用冗余备份、热拔插、RAID等技术快速恢复服务。l例如,Google公司不再是一味追求单个服务器的性能参数,而是更多地关注如何用堆积如山的集群来弥补单个服务器的性能不足。l在对单个服务器性能要求的降低的同时也减少了相应的资金需求。至于对于宕机的服务器,Google采用的是直接换掉。l云计算集群的加入,能够保证物联网真正实现无间断的安全服务。2.2云计算与物联网 (2 2)低成本的投入可以换来高收益,让限制访问服务器次数的瓶)低成本的投入可以换来高收益,让限制

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 总结/报告

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号