04.上.企业级性能管理与容量规划概述

上传人:繁星 文档编号:88158189 上传时间:2019-04-20 格式:PPTX 页数:77 大小:2.15MB
返回 下载 相关 举报
04.上.企业级性能管理与容量规划概述_第1页
第1页 / 共77页
04.上.企业级性能管理与容量规划概述_第2页
第2页 / 共77页
04.上.企业级性能管理与容量规划概述_第3页
第3页 / 共77页
04.上.企业级性能管理与容量规划概述_第4页
第4页 / 共77页
04.上.企业级性能管理与容量规划概述_第5页
第5页 / 共77页
点击查看更多>>
资源描述

《04.上.企业级性能管理与容量规划概述》由会员分享,可在线阅读,更多相关《04.上.企业级性能管理与容量规划概述(77页珍藏版)》请在金锄头文库上搜索。

1、企业级性能管理与容量规划概述,建立企业级容量规划、性能管理的业务效益,针对业务部门的需求,集成信息科技主管部门、软件开发中心、测试中心及运行中心等部门,通过统一、规范化的管理平台,对业务服务生命周期的容量规划、性能管理的流程。 通过对IT资源容量有效的管理及对运行性能持续地监控,降低业务服务中断的风险。 提前在新应用开发、测试阶段,建立起性能管理、容量规划的基线,从而了解新应用、或现有应用大版本变更对于现有生产运营带来的影响,从而降低与新的或改进的服务项目相关的风险。 提高IT资源容量的利用效率,在恰当的时候及时适量投资,这意味着采购流程再也不需要应付临时的采购或超前于需求而购买过度的容量,从

2、而总体成本降低了。 通过在确定变更对IT容量的影响时与变更管理密切配合,防止了由于不恰当或不正确的容量估计所导致的紧急变更,从而降低了业务运作中断的次数。 更为灵活的预测使得对业务需求的响应变得更快速和更准确。,容量规划、性能管理及相互关系,容量规划主要管理以下几个方面: 处理容量的购买成本相对于业务需求来说,是否合理以及处理容量是否以最有效的方式(成本vs容量)被加以利用? 当前的处理容量是否足够满足业务当前以及未来的需求(供给vs需求)? 现有的处理容量是否发挥了最大的效率(性能管理、调整)? 额外的处理容量准确地讲应该在什么时候形成? 是否知道未来需要什么样的IT容量以及何时需要这种容量

3、? 容量规划与性能管理是互为包含的关系,是一个循环的交互关系: 性能管理:为优化整体运营绩效而评价、监控和调整IT基础设施组件的性能的活动。 容量规划:根据容量管理数据库分析当前的情况、预测IT基础设施未来的使用情况以及为满足预计的IT服务需求而需要的资源,从而制定容量计划的过程。 建模:使用分析、模拟和趋势预测模型来确定服务的容量需求以及确定最佳的容量方案的过程。模拟需要分析各种不同的情形,并分析各种“如果怎么办”式的问题。,通过获取系统性能信息,全面掌控历史性能与容量趋势 依据当前系统信息,预测业务增长的情况下,系统资源的使用的和性能响应,目标:,维持现有IT服务能力的成本相对于组织的业务

4、需求而言是合理的吗? 现有的IT服务能力能满足当前及将来的客户需求吗? 现有的IT服务能力发挥了其最佳效果吗?,方法: 量化管理,致力于解决以下问题:,评价和改进现有服务能力,确保服务水平的承诺 评估当前IT资源的使用,确保高效地使用资源 分析并预测未来的业务需求,据此确定当前最佳容量以及未来应当配置的容量和对应的服务水平能力,容量规划和性能管理目标及方法,容量和性能管理是一个持续的管理流程,容量规划和性能管理是一个持续的管理流程,流程负责人设计并确定容量规划和性能管理流程 流程负责人设计并确定该流程的角色和责任 技术专家分析并确定管理需求,相关指标以及需要使用的工具,对于优化建议,技术专家负

5、责规划优化行动 技术专家负责利用相应的调优工具,进行相应的系统或应用的调优工作 优化后仍不满足要求,容量规划师负责提出增容建议,各管理环境的数据采集专家负责建立数据采集机制 数据采集专家根据流程定义的采集周期定期地使用相关的工具采集所需的容量和性能指标并进行存储,容量规划师根据容量管理报告,根据历史信息定期预测未来容量需求 对于增容建议,容量规划师负责制定相应的容量规划,各管理环境的数据评估专家根据已存的容量和性能指标,生成所需的性能管理报告、异常报告以及容量管理报告 技术专家根据异常报告分析异常指标,结合性能管理报告找到异常原因并提出改进建议(优化或增容),流程负责人负责监督管理流程的执行

6、流程负责人定期向上级汇报容量规划和性能管理的结果,容量和性能管理是一个持续的管理流程,容量规划和性能管理是一个持续的管理流程,重要角色 企业系统性能架构师 从宏观把控性能与容量的需求,技术以及流程 业务代表 作为业务部门的代表,提供性能标准,未来新业务开展及已有业务增长情况 数据评估与采集专家 采集,存储基础数据,生成所需的报告 容量规划师 跟踪项目确保与容量相关的服务级别合乎既定的要求 技术专家 作为某个特定领域的资深技术人员,深入分析优化的可能性并优化 流程负责人 类似于项目经理的角色,确保流程合规执行,容量和性能管理的人员组成,容量和性能管理的人员组成,管理报表分类,报表类型 管理层报表

7、,技术层报表 概况、趋势、异常、详细报表 固定报表(日、周、月、年趋势)和交互报表 专业条线报表 专业条块分类 主机系统,分布式系统 网络系统 存储系统 专业报告类型 性能报表 健康检查报表 性能对比报表 系统容量报表 容量预估报表 业务条线 交易种类和渠道统计报表,主机平台容量和性能管理报表,性能管理日报 生产主机系统性能健康检查日报 生产主机系统性能管理日报 生产主机操作系统专业性能日报 生产主机系统RMF III日报 生产主机联机子系统性能管理日报 生产主机数据库子系统性能管理日报 生产主机批量性能日报 生产主机存储性能及容量指标日报 性能管理周报 生产主机系统性能健康检查周报 生产主机

8、系统性能管理周报 性能管理月报 生产主机系统性能健康检查月报 生产主机系统性能管理月报 系统容量管理报表 容量预估管理报表,哪些由性能容量工具产生? 哪些需要系统手段产生,分布式系统平台监控系统硬件资源的性能报表,系统信息 包括虚拟空间利用率、页面读写错误情况、物理内存和虚拟内存使用情况、CPU利用率、平均负载情况 磁盘资源 包括空间利用率、节点(i-node)利用率、磁盘读写繁忙程度等。 进程 包括CPU利用率的进程、耗用内存最大的十个进程、进程利用情况列表 其它监控资源 磁盘性能 RPC调用的性能情况 用户访问情况 服务器网络使用情况 文件情况,网络硬件资源的性能报表,端口或线路的质量和使

9、用率,网络设备级报表 CPU利用率 内存利用率 Buffer利用率 端口、线路的报表: 端口速率 带宽利用率 丢包率 错包率 SAA,存储容量和性能管理报表,与系统有关的性能管理,参照主机系统、开放系统相关的内容 就存储子系统本身而言 卷和数据的均衡分布是使性能达到最大的最重要的因素 需要考虑cache block与文件系统及数据库的匹配 联机交易系统 最重要的IO性能指标是每秒的IO数和响应时间 其次是吞吐量 批处理应用 吞吐量是最需要重点考虑的 采用TPC等工具来实现对存储性能的监测。其中TPC所监测到的存储前端性能指标,可以和服务器上取得的RMF report,IO stat的值相对应。

10、 监测存储前端的卷的性能参数包括IO rate, data rate, response time,读写比,IO块大小等,其中读操作的cache命中率是判断IO特性的重要指标 后端性能参数主要包括array和rank级别的IO rate, data rate,response time,NVS full等参数,可以判断存储后端是否存在瓶颈,这些参数通常无法在服务器上取得 通过取得的性能指标,结合disk magic和capacity magic可以对存储更好地planning,容量、性能管理贯穿在整个解决方案的生命周期中,异地灾备中心,运行中心 及 同城灾备中心,开发中心,测试中心,数据中心,

11、信息科技 主管部门,SLA的性能需求,业务部门,建立 容量、性能管理委员会,由一部三中心的人员组成 按照SLA形成、维护性能的KPI 技术研究(产品性能白皮书,性能基线) 定期的容量规划评估会 根据容量预测,安排资源采购,性能监控及跟踪 性能、容量信息收集,分析,评估 系统性能调优,新应用性能预估、建模 大版本变更性能预估、建模 应用性能调优 应用性能建模,按照SLA进行性能测试 压力测试,需求、设计,开发,测试,发布,生产,研讨:公司在构建企业级容量评估、性能管理方面需要做哪些改进?,思考一下 组织架构? 规范流程? 人员技能? 辅助工具? 预算开销?,企业级性能、容量管理总体功能架构,投资

12、回报,服务级别报告,性能报告 技术条线,业务服务,管理报表记录/结构定义,SQL 查询,被管理技术模块,数据收集,企业级性能、容量管理总体平台参考架构,Tivoli Performance Modeling,RMF, SMF,Enterprise Portal,开发中心,测试中心,数据中心,信息科技 主管部门,性能管理的定义,性能管理就是计划、定义、测量、分析、报告和调整计算机资源性能的过程。这些资源包括: 主机系统硬件,如CPU,I/O等 操作系统和子系统,如z/OS,CICS,DB2等 数据网络 应用系统 服务 历史趋势分析和报告以及资源容量的规划也是和性能管理相关的重要内容,性能管理的目

13、标,性能管理的目标就是:通过有效地使用资源来达到性能服务水平(SLA)的承诺。 通过对性能的调整降低响应时间、提高吞吐量,在满足SLA的基础上减少消耗。,性能管理的目标,统一的性能报告,制定性能管理的标准和程序手册,性能管理的组织架构 性能管理人员和他们的职责 性能管理所适用的环境 性能测量的标准 报告的需求 性能管理工具 历史文件 趋势分析 性能管理例会 报告和解决性能管理中的问题,。,。,性能管理的主要模块,数据收集:每日收集性能数据,积累形成周、月、年度等数据为性能分析和趋势分析提供原始数据; 数据保留:制定性能数据的保存介质和期限; 信息处理:日常规定的性能报告或管理层要求的报告处理作

14、业; 信息报告:主要以管理层的要求为主。主要针对性能瓶颈的分析和确定何时需要进行升级。,性能管理周期,当解决了一个瓶颈后,重新测量、重新评估性能来验证没有造成别的限制并确保所做的变更升效了,性能管理的步骤,定义服务水平目标(SLA)和度量标准 收集性能数据 从性能数据中创建有价值的报表 分析性能报告来确定是否满足了目标 识别系统中的潜在瓶颈 分析可疑瓶颈处的详细性能数据 决定从哪可以获得所需的资源 验证是否消除了性能瓶颈,主机性能指标 -宏观性能指标,响应时间(Response Time) 外部吞吐率(ETR)和内部吞吐率(ITR) 系统饱和点(SDP) 资源使用率(Utilization),

15、主机性能指标 -宏观性能指标 响应时间,主机性能指标 -宏观性能指标 吞吐率,ETR: 按照Elapse Time来测量,注重系统容量; ITR: 按照CPU时间来测量,注重CPU的容量,提问:对于相同的工作负载, 哪个系统更好?,主机性能指标 -宏观性能指标 系统饱和点,SDP的定义是,为保证一个系统在小间隔内的使用率不超过100%,最大的平均大间隔的使用率。 大间隔、小间隔的选择(例如1小时、1分钟),决定于用户的忍耐程度。 例如,用户在一小时内不能容忍任何一分钟的使用率达到100%,那么小时平均使用率就不能超过计算出的SDP值。 假设,小时平均值为80%,而此小时内分钟峰值为92%,则S

16、DP=80*100/92 = 87%,混合工作负载时响应时间与CPU利用率关系图,主机性能指标 - 微观性能指标 I/O,IO Response = IOSQ + Pending + Connect + Disconnect IOS Queue Time: 表示在z/OS中设备等待的时间. Pending time: 表示从发出SSCH指令直到Channel和I/O控制器之间开始对话. Disconnect time: I/O操作已经开始,但是Channel和I/O控制器之间没有对话. Connect time: Channel和I/O控制器Cache之间作数据传输或交换控制信息.,应用性能指标,不同的代码编写方式对系统性能的影响是不一样的 应用程序性能指标体现在 代码的编写方式 CICS指令写法 DB2 SQL语句写法 文件组织方式及定义属性 其他 如果应用程序存在性能问题,ITR往往不会线性增长,导致不能正确预估系统容量 如果某支交易存在应用程序性能问题,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 工作范文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号