黄兵 Google云计算培训课件

上传人:我*** 文档编号:133558319 上传时间:2020-05-28 格式:PPT 页数:42 大小:4.69MB
返回 下载 相关 举报
黄兵 Google云计算培训课件_第1页
第1页 / 共42页
黄兵 Google云计算培训课件_第2页
第2页 / 共42页
黄兵 Google云计算培训课件_第3页
第3页 / 共42页
黄兵 Google云计算培训课件_第4页
第4页 / 共42页
黄兵 Google云计算培训课件_第5页
第5页 / 共42页
点击查看更多>>
资源描述

《黄兵 Google云计算培训课件》由会员分享,可在线阅读,更多相关《黄兵 Google云计算培训课件(42页珍藏版)》请在金锄头文库上搜索。

1、Google云计算原理 研究院黄兵 2 ReachedOurGoal 3 提纲 TMForum对云态度 4 4 Wehaveadream 愿景 计算机的服务能力可以作为一种商品进行流通 就像水 电 气一样取之方便 费用低廉 5 云计算定义 图 云计算概念模型 云计算 是一种商业计算模型 它将计算任务分布在大量计算机构成的资源池上 使各种应用系统能够按需获取计算力 存储空间和信息服务 6 云计算服务的部署形式 IaaS基础设施云 代表 亚马逊的S3 SaaS应用云 代表 salesforce的CRM PaaS平台云 代表 GoogleAppEngine Xasaservice 7 Amazon云

2、计算 1GB数据存放1个月为0 15美元 每个服务器租用1小时为0 1美元 Amazon的IaaS云计算思路 弹性计算云EC2为企业提供计算服务 简单存储服务S3为企业提供存储服务 Amazon的IaaS运用实例 8 亚马逊IaaS应用案例 纽约时报 使用亚马逊云计算服务 效果 在不到24个小时的时间里处理了1100万篇文章费用 累计花费240美元 利用自己服务器 时间 数月时间费用 多得多的费用 9 Google云计算 Google的云计算思路 浏览器 操作系统 10 隶属PaaS的Google云计算 Google云计算PaaS 属于部署在云端的应用执行环境支持Python和Java两种语言

3、通过SDK调用Google的各种服务 如GoogleMap Mail等用户可快速 廉价 可免费使用限定的流量和存储 地部署自己开发的应用 如创新的网站 游戏等 在下一章将具体介绍GAE具体的应用 11 Google云计算SaaS 隶属SaaS的Google云计算 提供在线 Word Excel PPT 提供在线MAP 提供在线日历管理 12 Google云计算平台技术架构分布式文件系统GoogleDistributedFileSystem并行数据处理MapReduce分布式锁Chubby结构化数据表BigTable Google如何实现云 将在第二章详细介绍 13 云计算概念入门 Q A 14

4、 提纲 TMForum对云态度 4 15 Google云计算原理 1 2 3 4 16 17 Google设计GFS的动机 Google需要支持海量数据存储的文件系统购置昂贵的分布式文件系统与硬件 是否可以在一堆廉价且不可靠的硬件上构建可靠的分布式文件系统 18 GFS的设计思路 GFS设计原则 机器失效不能视为异常现象能应付对大型 超大型文件处理支持大量用户同时访问GFS组成GFS集群 一个的Master和多个ChunkServer 块服务器 组成 并可以多客户端Client访问GFS设计要点每个文件拆成若干个64M文件块Chunk组成每个Chunk都由Master根据其创建时间指定Chun

5、kHandle 64 文件块被保存在ChunkServer本地磁盘中缺省情况下3处热备份Chunk块文件 19 GFS的设计思路 Client职责包含文件系统的API负责和ChunkServer和Master通信代表应用程序进行读写操作Client和Master进行元数据操作Client和ChunkServer进行文件数据操作Master职责负责管理所有文件系统的元数据元数据包括 命名空间 访问控制信息 文件到Chunk的映射信息等ChunkServer职责负责存储chunk文件块Linux文件系统 20 GFS的系统架构 应用程序 GFS客户端 GFS数据块服务器 Linux文件系统 GFS

6、主服务器文件命名空间 Chunk2EEE foo bar GFS数据块服务器 Linux文件系统 标注 数据信息 控制信息 文件名 chunk索引 向数据块服务器发指令 返回数据块服务器状态 Chunk句柄和位置 Chunk句柄 查找数据 返回数据信息 21 Question 文件为什么要被化分为64M Answer 1 可以减少Client和Master的之间的交互 减少Master的负载2 客户端可以在一个Chunk中完成许多操作3 可以减少TCP三次握手时间 另外这些信息都要被Master管理的缺点 有冗余 22 GFS架构的特点 采用中心服务器模式Master可以方便地增加ChunkS

7、erverMaster掌握系统内所有ChunkServer的情况 方便进行负载均衡不存在元数据的一致性问题不缓存数据必要性 Client流式读取 非重复读写可行性 Master本身管理多个Server 很复杂 23 GFS容错机制 ChunkServer容错每个Chunk有多个存储副本 默认是3个 分别存储于不通的服务器上每个Chunk又划分为若干Block 64KB 每个Block对应一个32bit的校验码 保证数据正确 若某个Block错误 则转移至其他Chunk副本 Master容错三类元数据 命名空间 目录结构 Chunk与文件名的映射以及Chunk副本的位置信息前两类通过日志提供容错

8、 Chunk副本信息存储于其它ChunkServer 这样Master出现故障时可恢复 24 GFS实验效果图 ChunkServer1 ChunkServer2 ChunkServer16 Master Client1 Client2 Client16 路由器1 路由器2 Master 25 Google云计算原理 1 2 3 4 26 并行计算基础 摩尔定律正在走向终结 单芯片容纳晶体管的增加 对制造工艺提出要求CPU制造18nm技术 电子泄漏问题CPU主频已达3GHz时代 难以继续提高散热问题 发热太大 且难以驱散 功耗太高 未来的发展 多核 27 什么样的问题适合并行计算 斐波那契序列

9、 Fibonacci X计算URL访问频率Y Map函数处理日志中web页面请求的记录 然后输出 URL 1 Reduce函数把相同URL的value值都累加起来 产生 URL 记录总数 结果 28 Google为什么需要MapReduce Google拥有海量数据 并且需要快速处理什么是MapReduce GoogleMapReduce架构设计师JeffreyDean JefferyDean设计一个新的抽象模型 使我们只要执行的简单计算 而将并行化 容错 数据分布 负载均衡的等杂乱细节放在一个库里 使并行编程时不必关心它们这就是MapReduce 29 Google并行运算编程模型 Map

10、Map Map 原始数据1 原始数据2 原始数据M Reduce Reduce 结果1 结果R 1 在编程的时候 开发者需要编写两个函数 Map in key in value Reduce key value1 value2 2 Map操作产生结果是对3 在Map Reduce之间系统把同一Key归类到Reduce3 Reduce操作对相同的Key进行归类处理 30 MapReduce实现机制 用户程序 1 分割 1 分割 1 分割 Master 工作机M 工作机M 工作机M 工作机R 工作机R 2 指派Map 2 指派Reduce 片段1 片段4 片段3 片段2 输入文件 3 Read 4

11、 本地存储 输出文件0 输出文件1 Map状态 本地存储 Reduce状态 输出文件 5 远程读取 6 写入文件 31 单词计数体现M R算法 HelloWorldByeWorldHelloChinaByeChinaHelloSi techByeSi tech 输入数据 MapReduce Hello 3Bye 3China 2World 2Si tech 2 Map Key Value for eachworld world invalue collect world 1 Reduce Key Value intcount 0 for eachwinvalue count collect K

12、ey count 1 32 HelloWorldByeWorldHelloChinaByeChinaHelloSi techByeSi tech 2 分割 分割 分割 HelloWorldByeWorld HelloChinaByeChina HelloSi techByeSi tech KEYVALUE KEYVALUE KEYVALUE 3 HelloWorldByeWorld HelloChinaByeChina HelloSi techByeSi tech MAP MAP MAP 33 4 Map输出 Fold Fold输出 34 Fold输出 5 Reduce输出 Reduce 35

13、 MapReduce容错机制 背景MapReduce设计初衷 由普通PC组成的集群来处理超大规模的数据 所以有效的错误保障机制是必不可少Worker容错Master周期性的ping每个workerMaster容错Master周期性的将Master的数据结构的写入磁盘 即检查点 checkpoint Master数据结构包括 Map和Reduce任务的状态 空闲 工作中或完成 以及Worker机器 非空闲任务的机器 的标识 36 Google云计算原理 1 2 3 4 37 提纲 TMForum对云态度 4 38 GAE部署云应用 Q A 课堂演示部署过程 39 提纲 TMForum对云态度 4

14、 40 TMFSeeSunnyFutureInTeleManagementWorldAmerican TMF简介 1 电信管理论坛 非盈利联盟组织2 会员遍布全球195个国家 700 会员公司3 我们公司也是会员 享受会员权利4 业界广泛使用的eTOM SID TAM NGOSS TMF最新框架技术 41 结束语 云计算的出现并快速发展 一方面是虚拟化技术 分布式计算等技术发展的结果 另一方面也是互联网应用不断丰富趋势的体现 目前 虽然有Amazon Google IBM Microsoft等在推 但云计算还没有一个统一的标准 云计算平台已经为很多用户所使用 但是云计算在行业标准 数据安全 服务质量 应用软件等方面也面临着各种问题 这些问题的解决需要技术的进一步发展 现有的研究大多集中于云体系结构 云存储 云数据管理 虚拟化 云安全 编程模型等技术 42 云计算 ThankYou Q A

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号