Paramon&Paratune应用运行特征分析器介绍2014版

上传人:飞*** 文档编号:34314257 上传时间:2018-02-23 格式:PPT 页数:23 大小:5.33MB
返回 下载 相关 举报
Paramon&Paratune应用运行特征分析器介绍2014版_第1页
第1页 / 共23页
Paramon&Paratune应用运行特征分析器介绍2014版_第2页
第2页 / 共23页
Paramon&Paratune应用运行特征分析器介绍2014版_第3页
第3页 / 共23页
Paramon&Paratune应用运行特征分析器介绍2014版_第4页
第4页 / 共23页
Paramon&Paratune应用运行特征分析器介绍2014版_第5页
第5页 / 共23页
点击查看更多>>
资源描述

《Paramon&Paratune应用运行特征分析器介绍2014版》由会员分享,可在线阅读,更多相关《Paramon&Paratune应用运行特征分析器介绍2014版(23页珍藏版)》请在金锄头文库上搜索。

1、Paramon & Paratune软件简介,北京并行科技有限公司,Paramon广泛应用于高性能计算、云计算领域等大型数据中心,一秒一刷新显示收集机群处理器、内存、网络、存储、能耗、License、作业等数据,生成.para应用运行特征文件,为大规模机群应用分析、设计、优化提供大数据支撑;同时,提供全过程机群及应用运行状态的实时监控、管理和性能异常报警。,Paramon和Paratune概述,Paratune用于分析由Paramon生成的.para应用运行特征文件,精准显示应用运行过程中的特征,为各类大规模机群应用建立大数据支撑平台,提供多样性(Variety)、体量化(Volume)、速度

2、化(Velocity)、有价值(Value)的应用运行特征数据库,帮助用户完成应用机群构建、机群应用运行过程重构、应用程序优化等工作。,Paramon软件架构,性能数据文件(.para文件),Client,Client,Client,Client,Server,系统级性能数据微架构级性能数据,远程登录管理远程操作管理并行命令管理报警事件管理显示节点软硬件信息统计报表,网络模块文件系统模块IO统计模块GPU管理模块MIC管理模块能耗管理模块进程管理模块作业管理模块,数据存储,数据显示,前台系统,后台系统,支持Linux和Windows,Paramon采集数据,性能数据模块系统级性能数据 CPU

3、USED%利用率CPU SYS%利用率Memory%利用率SWAP%利用率Ethernet Send速率Ethernet Recv速率Disk Read速率Disk Write速率微架构级性能数据Gflops浮点计算性能Memory BandWidth速率CPI,代码执行效率VEC%,向量化比例AVX%,AVX指令比例GIPS,每秒执行指令总数LLCM%,Last Level Cache MISS百分比,机群管理模块远程登录管理远程操作管理批量节点远程关机/重启批量节点清除SWAP自定义节点操作并行命令管理报警事件管理默认报警事件(智能识别低效进程,CPU系统时间报警,节点失效报警,CPU核数

4、缺失报警,内存总量缺失报警,磁盘总量使用情况的报警,网络状态的报警,.)自定义报警事件显示节点软硬件信息统计报表作业统计节点/集群统计,扩展模块网络模块InfiniBand 网络收发速率文件系统模块NFS读写速率IO统计模块tps, await, util%GPU管理模块NVIDIA GPU%MIC管理模块能耗管理模块节点POWER%利用率进程管理模块作业管理模块SLURMLSFSGETORQUE,独立于硬件平台,支持上千节点混合机群,Paramon监控单服务器,Swap,Memory,Paramon功能特点,每秒刷新负载极低与SLURM作业调度系统集成监控用户进程集成四项基本测试提高集群系统

5、运维效率快速识别应用性能瓶颈,在计算结点上Paramon程序负载非常小,计算结点上的Paramon程序,每秒刷新负载极低,设计目标为服务器CPU资源占用率低于0.1%,与SLURM作业调度系统集成,单独显示作业所在的节点,Paramon监控用户进程,显示每个CPU核心运行的进程ID和用户ID,格式:进程ID用户ID,节点主机名,集成四项基本测试,Linpack、Stream、IOzone、IMB测试硬件性能,找出系统瓶颈,同一屏幕内机群及应用状态实时报告,提高集群系统运维效率,6套机群1350节点实时监控,低效运行节点,CPU报警,节点离线报警,节点未启动,网络报警,内存报警,正常工作节点,一

6、目了然,Paratune单服务器应用性能分析,快速识别应用性能瓶颈,两组节点上作业应用性能应该相同,作业在节点组1上遇到性能瓶颈,节点组2,节点组1,快速识别应用性能瓶颈,放大,使用到SWAP交换分区,ParaPortal,ParaPortal是基于Paramon开发的,建立在B/S模式上的集群和应用运行性能展现工具,有如下功能:数据中心运行历史信息进行统计数据中心资产管理支持调度系统作业统计支持许可证使用历史信息进行统计,资产管理,节点监控,应用许可管理,作业管理,作业管理:显示所有历史作业信息,节点历史状态统计,节点统计:以节点为单位,根据时间点(半小时、一小时、今天、本周、本月、三个月、

7、半年、一年)进行统计分析,并生成报表,集群历史状态统计,集群统计:以集群为单位,根据时间点(半小时、一小时、今天、本周、本月、三个月、半年、一年)进行统计分析,并生成报表,单机版,V0.1.0,V1.0.0,V1.2.3,V2.0.0,V2.3.0,V3.0.0,V4.0.0,里程碑,里程碑内容,阶段,单机版时代2008.02,V0.1.0时代2008.05,V1.0.0时代2009.04,V2.0.0时代2011.09,V4.0.0时代2013.10,V3.0.0时代2012.09,单机版基本数据采集和分析,机群版基本数据采集和分析,支持IB网络,支持网络文件系统,机群远程命令管理,Parasoft软件发展历程,机群故障报警,优化软件性能,支持Gflops等微架构数据,支持GPU数据,机群并行命令,优化软件性能,提供应用进程分析,IO扩展包,集成作业调度系统,后台数据采集,简化软件安装,优化GPU数据采集,北京并行科技有限公司http:/,Q & A,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 资格认证/考试 > 其它考试类文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号