Power系统优化和监控最佳实践 v3

上传人:n**** 文档编号:45557135 上传时间:2018-06-17 格式:PDF 页数:70 大小:2.41MB
返回 下载 相关 举报
Power系统优化和监控最佳实践 v3_第1页
第1页 / 共70页
Power系统优化和监控最佳实践 v3_第2页
第2页 / 共70页
Power系统优化和监控最佳实践 v3_第3页
第3页 / 共70页
Power系统优化和监控最佳实践 v3_第4页
第4页 / 共70页
Power系统优化和监控最佳实践 v3_第5页
第5页 / 共70页
点击查看更多>>
资源描述

《Power系统优化和监控最佳实践 v3》由会员分享,可在线阅读,更多相关《Power系统优化和监控最佳实践 v3(70页珍藏版)》请在金锄头文库上搜索。

1、 Topic:Power系统优化和监控最佳实践 陈炽卉陈炽卉 IBM 顾问工程师顾问工程师 性能概述性能概述 性能是衡量系统生产效率的主要指标; 性能取决于如下两个主要方面: 吞吐率 响应时间 合理的性能预期是量化性能目标的基础 7am 8 9 10 11 12 1 2 3 4 5 6 Morning Crunch Lunch Dip 4 Oclock Panic 5 Oclock Cliff 7am 8 9 10 11 12 1 2 3 4 5 6 Morning Crunch Lunch Dip 4 Oclock Panic 5 Oclock Cliff 系统性能的组成部分系统性能的组成部

2、分 CPU资源 处理器主频以及数量; CPU调度算法的性能; 内存资源 Cache以及RAM的访问速度和容量; VMM虚拟内存管理算法的性能; I/O资源 磁盘访问的延迟(latency),磁盘、IO适配卡的数量与性能; IO设备驱动以及系统内核的性能; network资源 网卡以及物理网络的性能; 网络驱动、系统内核以及网络应用的性能; 影响性能的因素影响性能的因素 系统的瓶颈取决于一系列因素,例如: 系统的硬件配置 业务负载类型 操作系统的版本与配置参数 网络配置与拓扑 应用本身的效率 吞吐率 瓶颈点 如何采集性能数据如何采集性能数据 常见的数据收集工具包括nmon和PerfPMR; nm

3、on已经包含在AIX6.1/7发行版中; AIX6.1 TL3以及后续版本中默认运行topasrec进程,以300秒 间隔进行数据采集。topasrec每天生成一个*.topas文件,每 个文件保存6天。 可以使用topasout将其处理成nmon analyzer可以分析的格式; smitty topas PerfPMR可以在如下站点下载: ftp:/ 选择您使用的AIX系统版本; PerfPMR可能不定期更新,以增加新的功能,建议使用最新 的版本; 注意PerfPMR数据必须在性能问题发生时收集; 调优方法论调优方法论 Actions Actions Yes Is System CPU-B

4、ound? Is System Memory-Bound? Is System Disk-Bound? Is System Network-Bound? Actions Yes Actions Yes Yes No No No Actions Additional Tests 系统监控与调优系统监控与调优 CPU LPAR规划规划 经验规则经验规则 LPAR规划规划 为什么需要设置足够的为什么需要设置足够的entitlement ? Entitled CPU较低的情况(EC = 6.4, VP=64),工作负载加上来之后,unfolding 所有的CPU需要30秒。 LPAR规划规划 为什么需

5、要设置足够的为什么需要设置足够的entitlement ? Entitled CPU足够的情况(EC = 50, VP=64),工作负载加上来之后,unfolding 所有的CPU只需要5秒。 Monitor CPU usage nmon (63.6%) topas (63.6% / 1.5 = 42.4%) ps (63.6% / 8 = 7.95%) Actions Actions Yes Is System CPU-Bound? Is System Memory-Bound? Is System Disk-Bound? Is System Network-Bound? Actions Y

6、es Actions Yes Yes No No No Additional Tests Actions 系统监控与调优系统监控与调优 内存内存 判断是否存在内存不足的方法判断是否存在内存不足的方法 如果当前使用的内存页数超过了实际配置的内存页数,则认为出现了内存不足; 当前使用的内存页数为Virtual 页面和File Cache页面之和; 此时,系统层面一般可以观察到vmstat的pi/po,或topas的PgspIn/ PgspOut持续保 持非零值; 示例: # svmon -G size inuse free pin virtual memory 733184 731505 1679

7、 191889 933823 pg space 1572864 282872 work pers clnt pin 191624 0 265 in use 689073 0 42432 Virtual pages = 933823 (3647 MB) + File cache pages = 42432 ( 166 MB) - Total pages in use = 976255 (3813 MB) vs. Real memory = 733184 pages (2864 MB) 例如,查看文件内存的具体使用情况: # svmon -S O filtertype=client,filenam

8、e=on,sortentity=inuse,format=nolimit|pg Unit: page Vsid Esid Type Description PSize Inuse Pin Pgsp Virtual 940b14 - clnt /dev/fslv00:24577 s 2560000 0 - - /perfdata/powerstart/test.txt fd00fd - clnt /dev/bos_hd9var:110 s 2550 0 - - /var/adm/wtmp be01be - clnt /dev/bos_hd2:4213 s 2146 0 - - /usr/ccs/

9、lib/libc.a 990219 - clnt /dev/bos_hd9var:20610 s 1683 0 - - /var/opt/tivoli/ep/_jvm/jre/lib/ppc/libj9jit24.so f106f1 - clnt /dev/bos_hd2:21777 s 1160 0 - - /usr/java5/jre/bin/libj9jit23.so 。 利用利用svmon命令进行各种内存监控命令进行各种内存监控 1.If it is not broken, dont fix it ! 2.AIX5.3/AIX6.1/AIX7 .1参数参数默认值不完全相同默认值不完全相

10、同;不要把;不要把AIX5.3的相关设置的相关设置 直接迁移到直接迁移到AIX6.1/AIX7.1. 3.设置设置 lru_file_repage to 0, minperm%=3 更好的保护计算页面;更好的保护计算页面; 4.设置设置 page_steal_method to 1 选择基于列表的扫描算法提高效率;选择基于列表的扫描算法提高效率; 内存换页参数总结内存换页参数总结 AIX 5.3 默认值默认值 AIX 6.1/7.1 默认值默认值 minperm% = 20 maxperm% = 80 maxclient% = 80 strict_maxperm = 0 strict_maxc

11、lient = 1 lru_file_repage = 1 page_steal_method = 0 minperm% = 3 maxperm% = 90 maxclient% = 90 strict_maxperm = 0 strict_maxclient = 1 lru_file_repage = 0 page_steal_method = 1 POWER7/Power7+ 多芯片结构多芯片结构 AB bus XYZ bus POWER7/7+ (中高端系统中高端系统) Power 750+,760,770,780,795 2 memory Controller (68GB/s per

12、controller) 3x XYZ memory bus (节点之节点之内内) 2x AB memory bus (节点之节点之间间) 2节点节点(CEC) Power 780 D Model互联架构示例互联架构示例 (共共8 sockets) Power 770 MMD: 4 节点节点 (4 sockets*4c) = 64 cores Power 780 MHD : 4 节点节点 (4 sockets*8c) = 128 cores Power 795 FHB : 8 节点节点 (4 sockets*8c) = 256 cores 为了获得最优性能,每个为了获得最优性能,每个LPAR分区

13、必须尽可能分区必须尽可能 少跨越少跨越Chip/Node,以减少,以减少Remote/Distant 内内 存访问。存访问。 Process Local Distant Remote Node1 Node2 to node 3 to node 4 POWER7/Power7+多级别内存访问架构总结多级别内存访问架构总结 3-tier for multi-node systems (750+, 760, 770, 780, 795) Local 同一芯片内部的资源访问 Near 同一节点或Book内部的资源访问 Far 节点之外或Book之外的资源访问 2-tier for low-end sy

14、stems (刀片, 710, 720, 730, 740, 750, 755) Local 同一芯片内部的资源访问 Far 芯片之外的资源访问 Model/RAM Access Local Near/Remote Far/Distant Power 710/730 Power 720/740 Power 750 Same Chip N/A Other Chip Power 750+/760 Same Chip Same Node/DCM1 Different Node/DCM Power 770/780 Same Chip Other Chip but same CEC Different CEC Power 795 Same Chip Other Chip but same CPU Book Different CPU Book 1. DCM: Dual Chip Module AIX针对针对Power7/Power7+架构提供的增强内存亲和力的手段架构提供的增强内存亲和力的手段 Importance of Improved Memory L

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 电子/通信 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号