企业管理LenovoIntelligentComputingOrchestration管理员手册

上传人:cl****1 文档编号:557616348 上传时间:2022-08-15 格式:DOCX 页数:64 大小:4.51MB
返回 下载 相关 举报
企业管理LenovoIntelligentComputingOrchestration管理员手册_第1页
第1页 / 共64页
企业管理LenovoIntelligentComputingOrchestration管理员手册_第2页
第2页 / 共64页
企业管理LenovoIntelligentComputingOrchestration管理员手册_第3页
第3页 / 共64页
企业管理LenovoIntelligentComputingOrchestration管理员手册_第4页
第4页 / 共64页
企业管理LenovoIntelligentComputingOrchestration管理员手册_第5页
第5页 / 共64页
点击查看更多>>
资源描述

《企业管理LenovoIntelligentComputingOrchestration管理员手册》由会员分享,可在线阅读,更多相关《企业管理LenovoIntelligentComputingOrchestration管理员手册(64页珍藏版)》请在金锄头文库上搜索。

1、联想智能超算平台V2.1管理员手手册20155年9月联想企业业级业务务部门ssysttem x解决决方案研研发中心心前言41. 产产品简介介51.1 运行环环境51.2 名词解解释52. 使使用说明明72.1 登陆管管理员界界面72.1.1 切切换到用用户态界界面82.1.2 查查看集群群基本状状态1002.1.3 查查看机群群详细监监控信息息112.1.4 查查看机群群报警信息息122.2 用户/账户管管理1332.2.1 创创建用户户组1552.2.2 修修改用户户组1992.2.3 删删除用户户组2112.2.4 创创建计费费账户2232.2.5 修修改费率率252.2.6 充充值266

2、2.2.7 扣扣款2772.2.8 删删除计费费组2882.2.9 创创建用户户302.2.10 修改用用户3332.2.11 删除用用户3662.2.12 查看更更详细账账户记录录382.2.13 问题分分析及解解决办法法412.3 HPCC集群管管理4222.3.1 查查看HPPC集群群详细信信息4222.3.2 HHPC集集群的硬硬件远程程管理4432.4 作业调调度管理理472.4.1 队队列管理理472.4.2 作作业管理理482.4.3 作作业策略略管理4483. 注注意事项项493.1 系统重重启4993.1.1 IIO节点点正常工工作的时时候,管管理节点点重启5503.1.2

3、IIO节点点正常工工作的时时候,计计算节点点重启5513.1.3 IIO节点点正常工工作的时时候,登登录节点点重启5523.1.4 IIO节点点重启5533.1.5 整整个集群群重启5543.2 mpii程序的的安装位位置5553.3 用户目目录的绝绝对路径径553.4 管理员员发布公公告和修修改管理理员联系系信息555前言本文档的的读者需需要具备备一定的的高性能能计算,服务器器集群的的基础知知识,同同时对高高性能计计算中的的并行开开发,作作业调度度有一定定的了解解。1. 产品简介介联想智能能超算平平台是HPCC基础管理理软件,其其功能包包括有计计算机集集群管理理,集群群监控,作业调调度管理理

4、,集群群用户管管理,账账户管理理,文件件系统管管理等。本软件基基于BSS结构,用户可可以通过过浏览器器轻松登登陆到管管理界面面进行操操作,也也可以通通过其他他Linnux sheell工工具登陆陆到集群群登陆节节点进行行命令行行操作。1.1 运行环境境服务器:联想syysteem xx服务器器系列。操作系统统:CenttOS 6.55 或RRedHHat 6.55客户端:硬件:CCPU主主频2.0GHHz以上上,内存存1GBB以上。浏览器:推荐Fiireffox 或 CChroome。显示分辨辨率:推推荐12280*80001.2 名词解释释计算机集集群: 包含管理理节点、计算节节点等在在内的

5、资资源的统统称。作业: 完成特特定任务务的命令令序列。作业状态态:是指指作业在在调度系系统中的的状态标标识,包包括等待待、排队队、保留留、运行行、挂起起、结束束。节点状态态:是指指节点的的状态标标识,包包括空闲闲、已占占用、繁繁忙、停停机。作业调度度系统: 负责责接收、分发、执行、记账作作业的分分布式程程序。管理节点点: 运行行作业调调度,集集群管理理,用户户计费等等管理程程序的节节点。计算节点点:执行作业业的节点点。用户组:定义了了对资源源的访问问控制策策略,属属于同一一个用户户组的所所有用户户可以访访问相同同的集群群资源。计费组:也是计计费账户户,可以以一个用用户使用用也可以以几个用用户共

6、享享使用。用来对对集群使使用者进进行计费费,结算算等操作作。.2. 使用说明明2.1 登陆管理理员界面面打开浏览览器输入入集群管管理节点点的IPP地址,端口为为80880如:htttp:/100.2440.2212.28:880800(客户户端必须须可以直直接访问问集群管管理节点点)。并看到如如下示图图:图1: 登陆界界面用户名的的类别分分为两种种:管理理员和操操作员。管理员员可以看看到整个个计算机机集群和和所有用用户的信信息,而而操作员员只能看看到自己己有权限限访问的的资源和和自己的的用户信信息。如果是管管理员用用户,输输入用户户名和密密码后,用鼠标标点击登登陆按钮钮可以看看到管理理员界面面

7、下图:图2: 管理员员主界面面2.1.1 切换到用用户态界界面管理员可可以任意意切换到到用户界界面,并并且像用用户一样样使用HHPC集集群。用鼠标点点击右上上角其他他链接,继而点点击切换换到用户户界面:图3: 切换到到用户界界面接下来就就可以看看到用户户界面:图4:用用户界面面2.1.2 查看集群群基本状状态在管理员员主页上上,还可可以看到到整个集集群的基基本状态态:最顶上一一行的导导航栏显显示了三三个按钮钮图标:主页:当当前页,显示集集群基本本信息。资源:显显示HPPC集群群所有机机器的详详细信息息页。详详情见22.3用户: 用户管管理页,管理员员可以对对用户/组,账账户/费费率做一一些基本

8、本操作。详情见见2.22进入主页页后,可可以看到到以下信信息:m:集群群名字 (注:集群名名字可以以在/ettc/cclussterr.coonf中中通过属属性DOOMAIIN来配配置,如如DOMMAINN=m,但但是集群群名字必必须符合合域名命命名规则则)。调度器:调度器器服务的的状态,绿色代代表调度度器工作作正常,红色代代表调度度器没有有正常工工作。并行文件件系统:并行文文件系统统的状态态,绿色色代表调调并行文文件系统统工作正正常,红红色代表表并行文文件系统统没有正正常工作作。网络吞吐吐:服务务器集群群网络的的吞吐量量,包括括读速率率和写速速率。集群CPPU: 服务器器集群CCPU的的利用

9、率率,包括括已经被被占用的的CPUU核数和和集群总总共具有有的CPPU核数数。集群内存存:服务务器集群群内存的的利用率率,包括括已经被被占用的的内存大大小和集集群总共共具有的的内存大大小。集群存储储:服务务器集群群存储空空间的利利用率,包括已已经被占占用的存存储空间间大小和和集群总总共具有有的存储储空间大大小。作业:显显示作业业的历史史信息,包括运运行中的的作业数数,等待待中的作作业数和和结束的的作业数数。管理理员可以以选择显显示全部部队列的的作业数数,也可可以指定定显示某某个队列列的作业业数。时时间上可可以选择择分别显显示:过过去一小小时,过过去一天天,过去去七天,过去三三十天的的作业数数。

10、类型型上可以以选择分分别显示示未完成成和已完完成的作作业数。节点占用用情况:显示计计算机集集群中节节点占用用的情况况:包括括忙碌,占用,空闲和和关机。 判断断这些节节点占用用情况的的主要依依据是各各个节点点的平均均每分钟钟的进程程负载量量。2.1.3 查看机群群详细监监控信息息用鼠标点点击右上上角其他他链接,继而点点击查看看详细监监控信息息: 图5-11:查看看详细监监控信息息用户界界面图5-22:查看看详细监监控信息息用户界界面2.1.4 查看机群群报警信息息如果集群群中部署署了报警警模块,用鼠标标点击右右上角其其他链接接,继而而点击查查看报警警信息,查看NNagiios报报警信息息图6:查

11、查看报警警信息2.2 用户/账账户管理理用户管理理中有三三个概念念:用户户,用户户组和计计费组(也称计计费账户户)。用户组:一组HHPC集集群用户户,他们们具有相相同的队队列访问问权限。它的属性性如下:组名:用用户组的的名字。用户组的的状态:包括有有“正常”、“创建中中”、“更新中中”、“删除中中”和“无效”。用户数:所包含含的用户户数目。可用队列列:可以以访问的的队列的的名称(队列必必须事先先创建好好,创建建详情可可以参照照章节22.4.1 队队列管理理)。最近更新新:最近近一次信信息更新新的时间间以及相相关的消消息。计费组(计费账账户):计费账账号,可可以被一一个用户户独自使使用,也也可以

12、被被多个用用户共享享使用。当计费费组成员员在集群群中运行行应用程程序时,所属计计费组账账户中的的费用会会根据其其运行的的应用程程序占用用的CPPU核数数和时间间进行扣扣除。它的属性性如下:组名:计计费组名名字。费率:单单位机时时所用金金额。若若费率为为1,代代表这个个计费组组的任何何成员若若占用11个CPPU ccoree,时间间为1小小时,那那就要付付1块钱钱。已用机时时:成员员的应用用程序一一共占用用了多少少:CPPU(核核数) * 时时间(秒秒)。已用金额额:该计计费组的的成员总总共所花花费的金金额。由由于费率率可以根根据需要要调整变变化,当当前已用用金额可可能不等等于当前前已用机机时*

13、当当前费率率。剩余金额额:该计计费组里里还剩下下的金额额。最近更新新:最近近一次更更新的时时间以及及相关的的消息。用户:HHPC机机群的个个体用户户。它的属性性如下:角色:管管理员或或操作员员。管理理员可以以看到整整个集群群的状况况。操作作员只能能看到和和自己相相关的队队列,作作业的状状况。用户名:用户名名字。用户组:所属用用户组。计费组:所属计计费组。密码:用用户密码码。用户的状状态:包包括有“正常”、“创建中中”、“更新中中”、“删除中中”和“无效”。电子邮箱箱:用户户电子邮邮箱。最近登录录时间:用户最最近一次次登录的的时间。最近更新新:对该该用户的的最近一一次信息息更新的的时间以以及相关

14、关的消息息。2.2.1 创建用户户组管理员首首先需要要创建用用户组,在系统统初始化化时,系系统已经经创建一一个用户户组(默默认是ddefaaultt_oss_grroupp)。建建议管理理员创建建新的用用户组来来使用。图7:用用户组管管理界面面点击“添添加”按钮,弹出如如下对话话框:图7-11:创建建用户组组界面管理员可可以输入入系统中中还未使使用的用用户组名名,并选选择可用用队列。(队列列必须事事先创建建好,创创建详情情可以参参照章节节2.44.1 队列管管理)系统初始始化配置置完成以以后,系系统内部部有一个个默认队队列:bbatcch. 它的aacl_grooup_enaablee被设为为fallse. 也就就意味着着它不可可以被某某一个用用户组独独占,所所有用户户组的用用户都可可以访问问。因此此这里是是必选。在本例中中,图示示里还有有一个队队列为管管理员事事先创建建好的队队列:qqueuueteest11和quueueetesst2。queeuettestt1的aacl_grooup_enaablee属性为为fallse,这也就就意味着着它也不不可以被被某一个个用户组组独占,所有用用户组的的用户都都可以访访问。因因此该队队列是必必选的。queeuette

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 商业计划书

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号