如何利用应用自己的数据来保证系统的稳定说课讲解

上传人:yuzo****123 文档编号:138721975 上传时间:2020-07-17 格式:PPTX 页数:46 大小:5.06MB
返回 下载 相关 举报
如何利用应用自己的数据来保证系统的稳定说课讲解_第1页
第1页 / 共46页
如何利用应用自己的数据来保证系统的稳定说课讲解_第2页
第2页 / 共46页
如何利用应用自己的数据来保证系统的稳定说课讲解_第3页
第3页 / 共46页
如何利用应用自己的数据来保证系统的稳定说课讲解_第4页
第4页 / 共46页
如何利用应用自己的数据来保证系统的稳定说课讲解_第5页
第5页 / 共46页
点击查看更多>>
资源描述

《如何利用应用自己的数据来保证系统的稳定说课讲解》由会员分享,可在线阅读,更多相关《如何利用应用自己的数据来保证系统的稳定说课讲解(46页珍藏版)》请在金锄头文库上搜索。

1、容量规划与保护,大纲,容量规划 需要哪些数据 单机容量 依赖容量 容量保护 Web server 层面 代码层面,容量历程,淘宝某应用某机房机器变化走势图,机器预算 经验 应用能不能支撑? 不知道 经验,结果 如果遇到突发事件(全国哀悼日)流量突然上涨。应用支撑不住了就需要紧急加机器,加多少也不清楚,反正能加多少是多少,所有人都高度紧张。,容量历程,容量历程,容量规范,容量水位,水位=(流量QPS/性能QPS)*100%,流量QPS 单机流量QPS 集群流量QPS 性能QPS 单机性能QPS 集群性能QPS=机器数*单机性能QPS,容量规范,通过容量水位来确定机器的增减 安全水位(标准水位)

2、危险水位 加机器水位 减机器水位,容量规范,水位线,容量实施,需要获取到应用的真实性能数据 需要获取应用的流量数据 容量计算公式 依赖容量计算公式,容量规范,某应用线上压测结果,某应用线下压测结果,Load 4.5 cpu 30%左右,性能数据,正式环境来实施性能压测,性能获取方式,线上压测原则 不是为了压测应用极限负载 而是获取应用稳定的最高负载,线上压测,分流模式通过将多台的机器流量汇聚到一台机器上 负载均衡 App configserver 日志回放模式通过读取web server 日志,并将日志中的get 请求重新请求道某个机器上 带cookie的 不带cookie,应用访问类型 非登

3、录读应用 登录读应用 写应用,淘宝架构,线上压测架构,例子一-分流模式,例子二-分流模式,例子三-日志回放模式,容量规划,压测操作可控性 随时可以手动或自动进行 随时可以停止 过程可视 完善的保护机制 数据监控采集 完善的监控阀值设置 异常的保护机制,容量规范,容量规划,流量QPS 通过统计web server日志,获取应用的单机流量QPS和集群QPS。,注意: 使用的是高峰期的平均QPS。不同的应用高峰期时段不尽相同,根据实际情况来设置。 为什么不直接用最大值? 这个主要是考虑到流量的波动性,平均值使容量水位更加稳定,容量规范,容量计算,实现原理:通过当前的应用机器数与性能QPS的乘积获取到

4、应用整个集群的可以承受的最大流量。在与当前集群流量QPS的比较就能计算出需要的机器数量,计算公式: 系统水位 =流量qps/性能qps 理论机器数 = 集群流量qps/性能qps 安全机器数=理论机器数 /安全水位,容量计算,例子:,性能QPS 100 机器数量 20台,集群稳定负载能力 = 100*20=2000,预计双十一流量 = 20000 水位= 1000% 理论机器数= 200台 安全机器数量=200/安全水位=200/40%=500台,活动场景一,日常场景二,实际流量= 2000,理论机器数= 20台,安全机器数量=20/安全水位=20/40%=50台,双机房部署-安全水位为40%

5、,应用已经在危险的边缘需要马上加30台,为了双十一安全 机器数需要加到500台才行,水位= 100%,容量规划,容量规范,依赖容量,依赖容量,依赖容量,关系 直接依赖、间接依赖 依赖之间的调用量 依赖之间的强弱,依赖容量,依赖容量,调用轨迹,Eagleeye,记录应用程序完成一次调用需要走过的所有依赖应用的信息,数据统计,依赖容量,依赖容量,转化率,refer,*,依赖容量,最终执行路径下的容量情况,createOrderForTaobao,限流降级,限流: 超过自身容量范围之外的流量暂时拒绝访问 降级: 在自身容量不足的情况下 将某些非关键路径上的请求调用暂时关闭,并将这些容量留给更加重要的系统 将自身执行路径上某些不影响业务的调用暂时关闭增加自身容量,限流降级,作用范围,Web Server Servlet 容器,限流降级,职责分工,TMD 针对集群流量防御,面向集群的流量暴涨。 优点: 可以根据集群统计分析数据,并作出对应的决策。 缺点: 需要有一个数据分析过程,无法做到瞬间响应。只能作用于Http 请求,Stable Switch 针对机器单体的流量防御 优点: 在流量瞬间暴涨情况下,立即作出限流反应。同时也可以服务于服务应用 缺点: 只是作用于自身,盲目的排除一切多余流量,互补,淘宝瞬间流量,TMD的原理,Stable Switch的原理,Thank You,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号