《云计算导论》李伯虎、李兵云计算导论第4章

上传人:E**** 文档编号:100351219 上传时间:2019-09-23 格式:PPT 页数:41 大小:10.84MB
返回 下载 相关 举报
《云计算导论》李伯虎、李兵云计算导论第4章_第1页
第1页 / 共41页
《云计算导论》李伯虎、李兵云计算导论第4章_第2页
第2页 / 共41页
《云计算导论》李伯虎、李兵云计算导论第4章_第3页
第3页 / 共41页
《云计算导论》李伯虎、李兵云计算导论第4章_第4页
第4页 / 共41页
《云计算导论》李伯虎、李兵云计算导论第4章_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《《云计算导论》李伯虎、李兵云计算导论第4章》由会员分享,可在线阅读,更多相关《《云计算导论》李伯虎、李兵云计算导论第4章(41页珍藏版)》请在金锄头文库上搜索。

1、云计算导论,李静远,阿里云,第4章 云计算系统的管理与服务,第4章 云计算系统的管理与服务,4.1 云计算系统的管理 4.2 云服务质量与评价 4.3 云计算系统的运维 4.4 DevOps及其实践,第4章 云计算系统的管理与服务,运营商视角,用户视角,云计算系统本身的研发,云计算上的运维和实践,4.1,4.2,4.3,4.4,4.1 云计算系统的管理,供应链管理 云原生硬件的研发,敏捷开发云软件研发,云产品规划流程 云产品分类体系,4.1.1 云计算系统的硬件管理,4.1.1 云计算系统的硬件管理,概念:供应链是围绕核心企业,从配套零件开始到制成中间产品及最终产品、最后由销售网络把产品送到消

2、费者手中的一个由供应商、制造商、分销商直到最终用户所连成的整体功能网链结构。供应链是一门非常复杂的学问 云计算对供应链的“多、快、好、省”四大具体优化目标,快,省,多,好,在21世纪初云计算服务开始的早期,各个云计算厂商通过硬件的管理实践总结出经验,不约而同对云计算的硬件发展方向达成了通用性、低成本性的共识,4.1.1 云计算系统的硬件管理,云原生的硬件 实体化的云服务器,云上用户需求所产生的对高性能计算的强烈需求,也在挑战着IaaS层的软硬件虚拟化实现。 “云计算的服务器就应该长成今天这个样子吗?标准化服务器对云计算就是好的吗?对虚拟化就是好的吗?” 例子: 在搜索引擎上做一次搜索,150毫

3、秒还是300毫秒返回结果其实对客户来说没有太大感觉,但是300毫秒的返回时间会直接把广告的营收拉低20%.,4.1.1 云计算系统的硬件管理,云原生的硬件 实体化的云服务器,4.1.1 云计算系统的硬件管理,云原生的硬件 实体化的云服务器,虚拟机服务的特点,物理机服务的特点,4.1.1 云计算系统的硬件管理,云原生的硬件 实体化的云服务器,理想的云服务器形态:同时消除掉虚拟机和物理机的缺陷,资源弹性,秒级交付,自动化运维,接口标准统一,性能无损,硬件级强隔离,虚拟机的优势,特性无损,物理机的优势,4.1.1 云计算系统的硬件管理,神龙计划(Project X-Dragon),4.1.1 云计算

4、系统的硬件管理,虚拟机 实例,虚拟机 实例,新型 计算 实例,新型 计算 实例,神龙架构的硬件服务器(为虚拟化而生),虚拟化 2.0 Hypervisor,计算虚拟化,存储虚拟化,网络虚拟化,新型 计算 实例,X86,ARM,GPU,新型 计算 实例,FPGA,4.1.3 云计算系统的产品管理,云计算产品规划管理流程,4.1.3 云计算系统的产品管理,云计算产品的分类体系ACID-S,4.1.3 云计算系统的产品管理,为什么要把AI/IoT/DataPlatform产品与云产品统筹规划?,AI/BigData,IoT,4.2 云服务质量与评价,4.2.1 云服务SLA协议,SLA的法律属性导致

5、其内容繁杂,书写的文字也会以法律上更加清晰为准,而不会更多考虑可读性的问题 云计算的复杂性,导致能够稳定提供公有云等大众化服务的服务商数量不可能太多,导致云服务商SLA条款变成了一种“take it, or leave it”的铁板,只能全盘接受,4.2.1 云服务SLA协议,数据安全是一切的重中之重,如果数据安全不能在SLA条款中得到充分保证,则上云是不可能的 务持续性也必须被重点考虑 云服务商要保证具体业务的不间断,并对特殊情况下宕机后的的情形给出充分的应对预案 选定的云服务商必须具有雄厚的经济实力,能够保证持续不断的开展云计算基础服务 有些令人意外,但事实上价格因素只能位居第三位,因为价

6、格只涉及公司利润的多寡,而数据安全和服务持续性则攸关公司的生死,4.2.2 用户接口设计使用评价,云API接口特别重要 云计算系统本身提供庞大的用户接口,将系统的能力暴露给程序开发者。因此用户接口就变成了云计算系统一个非常重要的窗口,通过这一窗口,云计算系统不再是一个封闭的系统,而是一个共享的资源库,一个开放的生态系统 对接口的评价维度,4.2.3 售后服务体系,公有云由于公共基础平台的属性,其用户的差异性很大,因此在传统的电话中心售后的基础之上,云售后服务还应根据不同用户的能力和特点,给出定制的服务 云计算厂商应该对普通用户、开发人员、企业三类用户,应当灵活给出不同的服务模式,构建支持计划体

7、系,售后服务体系,4.2.3 售后服务体系,对企业用户而言,使用云基础设施开发项目、发布服务,需要有云上开发知识和背景的专业人才 一方面,需要有人梳理云上的知识经验,将其系统化为有基础课程、有专业应用课程的课程体系 另一方面,也需要有全面的人才能力认证制度,让企业在招聘的时候能够有快速的参考系来评判潜在的员工,就如外语、音乐的考级一样,培训认证体系,4.2.3 售后服务体系,云上的长期用户,特别是使用服务的开发者都会有一种体感: 仅仅参考云产品说明书,电话咨询使用中遇到的问题,或者在搜索引擎上搜索前人的经验,都不能完全解决自己的问题 大多数问题都是业内资深的专家、开发者讨论出来的 因此需要有一

8、个供所有开发者、技术爱好者、厂商专家等在一起深度讨论、涵盖传统BBS、公众号、微博等交流功能于一体的技术讨论平台,技术生态、技术社区,云栖社区,AWS技术社区,Azure技术社区,华为云社区,开源中国,CSDN,4.3 云计算系统的运维,4.3.1 云产品运维准入标准,云产品运行在大规模云平台上,其产品设计运维准入标准要比普通软件产品严苛许多 产品设计运维准入 运维监控工具,(1)基础监控包括:系统级别的,CPU、内存、网卡、负载等 (2)应用级的监控包括:整体应用的工作状态、负载情况监控等等,4.3.2 数据中心自动化运维,主动故障预防 及时故障发现 智能故障定位 自动故障修复,案例: 某云

9、数据中心有百万级的服务器规模,在保障用户级99.95%甚至更高服务质量的前提下,试图大大提高运维效率,使得人均维护效率大大提高 通过公司自行研制的自动化与智能化运维系统,目前已做到了11个运维人员即可维护10万台设备的效果,资源使用率从10%以下提升至4050%.,4.3.3 数据中心灾备,经典案例 911事件发生后,摩根士丹利在世贸大厦25层办公场所全毁,3,000多员工被迫紧急疏散的情况下,半小时内就在灾备中心建立了第二办公室,第二天就恢复全部业务,可谓金融灾备的典范。与之相反,纽约银行(Bank of New York)在世贸大厦的数据中心全毁,通讯线路中断后,缺乏灾备系统和有力的应急业

10、务恢复计划,在一个月后不得不关闭一些分支机构,数月后不得不破产清盘。 在云时代,大量的金融、能源等核心行业的核心业务已经完全迁上云端,如果再一次发生类似911的重大事件,损失就不是一个点(企业),而是一个面(企业群)。金融机构聚集的世贸大厦里的大量数据化为乌有,这样的灾难在云计算时代绝对不可以发生,4.3.3 数据中心灾备,4.3.4 数据中心绿色节能,一个云数据中心的耗电量是非常惊人的,大型数据中心的用电量几乎与一座中型城市相当,数据中心高耗能会带来诸多方面的问题 高耗能给数据中心周边的供电能力提出了很高的要求 高耗能会极大地增加的运营成本,降低企业的利润率,不利于企业的发展 高耗能意味着大

11、量的二氧化碳排放,将造成生态环境恶化 常见节能技术,4.3.4 数据中心绿色节能,PUE (Power Usage Effectiveness)是通行的数据中心电力使用效率的衡量指标 PUE越接近1,表示数据中心的绿色化越高。 国家标准数据中心资源利用电能能效要求与测量方法GB/T32910.3-2016给出了更为详尽的计算数据中心机房电能使用效率(EEUE:Data Center Electric Energy Usage Effectiveness)的计算公式:,4.3.4 数据中心绿色节能,4.3.4 数据中心绿色节能,案例1(谷歌) 谷歌在Dallas 市的哥伦比亚河畔的数据中心,通过

12、在河畔建造大型冷却塔为数据中心制冷的方式,节约了大量的能源 案例2(阿里) 阿里张北云计算基地计划占地630亩,预计规模为数十万台服务器 阿里云选址在张北建设数据中心,原因之一在于张北丰富的风能和太阳能资源,该地区目前风电装机容量达233万千瓦以上、签约光伏开发总规模14万千瓦、年风电光伏发电量达60亿千瓦时,为100%清洁能源 该地区常年低温、平均温度2.6摄氏度,预计全年只有两周需要开启传统的压缩机空调制冷,仅制冷能耗就能降低近60%。张北两座数据中心的设计PUE均低于1.25,最低可以达到1.13,达国际领先水平,4.3.6 云资源弹性调度,弹性调度 指根据不同时刻、不同功能和性能要求,

13、云计算资源的自动化增加和移除的调度方式。资源的弹性调度可以应用在周期性有规律的场景下,也可能应用在临时突发的资源需求场景下。满足这样要求的云计算系统底层软件环境,称之为弹性操作系统。,4.3.6 云资源弹性调度,2017 阿里双十一,Payment maximum 256,000/sec,Order maximum 325,000/sec,Cloud Computing Infrastructures of the new era,4.4 DevOps及其实践,4.4.1 DevOps概念及其内涵,对于计算机软件研发行业,DevOps可以被定义为一种提倡开发环节和运维环节之间高度协同,从而在完

14、成高频率部署的同时,提高生产环境的可靠性、稳定性、弹性和安全性的研发方式,4.4.2 传统企业实现DevOps上云,传统DevOps VS 基于云或容器的DevOps,4.4.3 传统企业实现DevOps上云,一个案例:客户上云使用了持续集成/持续部署(Continuous Integration/Continuous Deployment,CI/CD)方案 这一方式将与集成和部署所有的相关人员、环境、基础设施集成到同一个大的解决方案中(左图) 用户在每个步骤阶段都有对应的工具(右图),习题,4-1 云计算系统早期的服务器为什么会选用标准化的管理模式?后来为什么又会出现非标准化的服务器?你觉得

15、都有哪些云计算场景需要特殊的硬件设计呢? 4-2 请任意选择一个境外主流云计算服务商、以及一个境内主流云计算服务商的官方网站,首先比较两者之间对产品分类的方式有什么相似性与不同,然后将其售卖的产品清单提取出来并进行比较,尝试总结两至三条国际国内云计算服务商产品的差异。,习题,4-3 请收集互联网上三个关于云服务SLA的争议索赔案例,并尝试分析双方的争议点在哪里。在云计算服务能力逐渐集中于主要厂商手中,而用户却大众化的现状下,怎眼才能避免某些争议判例的出现呢? 4-4 试列举出云计算服务的主要售后服务形式,并详述每一种形式的具体实现方式。,习题,4-5 一个新的云产品上线前,如果你是最后需要把关的人,你会设置什么样的标准来确保产品有一个成功的生命周期呢?试从产品的目标用户、软件设计、系统运维等多角度阐明你的想法。 4-6 云数据中心的设计方案,需要重点考虑哪些因素?试从灾备设计、节能设计、自动运维设计等角度给出全面的设计报告。,习题,4-7 云资源弹性调度指的是什么?你认为在互联网服务中哪些场景下,需要对云资源的弹性调度策略做专门的或者提前的优化措施? 4-8 DevOps和敏捷开发的不同点在哪里?两者如何配合才能更好的提高开发、部署、运维效率?如果你是云上一款名为“计算器”产品的产品经理,你怎样利用DevOps来提高开发效率?请详述具体工作思路并给出计划书。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号