lenovo intelligent computing orchestration 白皮书

上传人:第*** 文档编号:32687817 上传时间:2018-02-12 格式:DOC 页数:31 大小:1.35MB
返回 下载 相关 举报
lenovo intelligent computing orchestration 白皮书_第1页
第1页 / 共31页
lenovo intelligent computing orchestration 白皮书_第2页
第2页 / 共31页
lenovo intelligent computing orchestration 白皮书_第3页
第3页 / 共31页
lenovo intelligent computing orchestration 白皮书_第4页
第4页 / 共31页
lenovo intelligent computing orchestration 白皮书_第5页
第5页 / 共31页
点击查看更多>>
资源描述

《lenovo intelligent computing orchestration 白皮书》由会员分享,可在线阅读,更多相关《lenovo intelligent computing orchestration 白皮书(31页珍藏版)》请在金锄头文库上搜索。

1、联想智能超算平台Lenovo Intelligent Computing Orchestration产品白皮书 v2.1Lenovo EBG System x Solution Team目录Lenovo Intelligent Computing Orchestration.1产品白皮书 v2.1 .11. 概述 .31.1 概要 .31.2 目标读者 .32. 联想 Lenovo Intelligent Computing Orchestration解决方案 .42.1 解决方案架构 .42.2 软件架构 .82.2.1 软件列表 .82.2.2 推荐硬件列表 .92.3 联想 System

2、 x 解决方案团队所做的努力 .102.4 方案功能和优势 .112.4.1 功能 .112.4.2 优势 .133. 推荐配置 .163.1 10 个节点 HPC 集群推荐配置 .163.2 20 个节点 HPC 集群推荐配置 .173.3 50 个节点 HPC 集群推荐配置 .183.4 100 个节点 HPC 集群推荐配置 .184. 典型应用场景功能 .204.1 机群管理、监控和报警 .204.2 作业提交与查看 .264.3 用户及计费管理 .291. 概述1.1 概要随着互联网的普及和 IT 业的高速发展,高性能计算已经不再是少数大公司或大型科研机构的专属要求,而是被越来越多的包

3、括政府,教育科研,石油石化,制造,军工和生命科学类的客户所需要和接受。当前高性能计算的解决方案中,大多数企业级商用软件产品解决方案如 IBM Platform Computing 十分昂贵和庞大。这就造成很大一部分HPC 客户无法承受。另外还有一些 HPC 客户对高性能产品和方案有着很强的定制化和二次开发的需求,他们并不希望自身被复杂的庞大的商业软件所绑架。基于以上需求和综合考虑,联想 EBG 组装研发了 Lenovo Intelligent Computing Orchestration 联想智能超算平台。它是基于主流的高性能计算开源项目,并由 Lenovo EBG 研发团队加入了一些符合自

4、身的特性功能插件,并且在联想 System x 平台上测试和验证。1.2 目标读者本文档主要面向联想公司内部技术人员,销售人员,客户中的技术人员,联想签约合作伙伴和数据中心管理和运维人员。本文档读者需要具备一定的高性能计算,服务器集群的基础知识,并对服务器和数据中心基础架构以及存储,网络设备有一定的了解。2. 联想 Lenovo Intelligent Computing Orchestration解决方案2.1 解决方案架构一个完整的 HPC 集群由以下五类节点组成:1管理节点管理节点作为 HPC 集群的核心,肩负着集群管理,监控,调度,策略管理,用户和账户管理等主要功能。我们选用一台 x3

5、650 M4/M5 搭载 2 块 E5-2600 v2/v3 CPU, 64GB的内存,2 块 300GB 的硬盘和相应的网卡或 IB 卡作为管理节点的硬件平台。开源软件方面,我们选用 xCAT 和 Ganglia 来担负集群管理,部署和监控的任务,xCAT 和 Ganglia 在 HPC 集群管理和监控方面有着很多年的沉淀,很多 HPC 集群管理员对他们的使用十分熟悉。在任务调度方面,我们选用 TORQUE 加 MAUI 这样的黄金组合,他们也是被市场多年验证过的成熟开源软件产品。计费方面,我们选用和 MAUI 同属一个社区的 Gold,来尽量减少产品间的冲突。2计算节点计算节点的功能顾名思

6、义,就是完成高性能计算的任务。我们选用非常适合高性能计算的服务器 NeXtScale nx360 M4/M5 或 Flex x240 M4/M5,搭载 2 块 E5-2600 v2/v3 CPU, 64-128GB memory,1 块 300GB HDD 和相应的网卡或 ib 卡作为计算节点的硬件平台。开源软件方面,我们预装了多种开源的 MPI 运行库,包括MPICH,OpenMPI, MVAPICH2,基本上涵盖了市面上所有最通用的MPI 开源库。 用户也可以选装 Intel 公司的 Intel Parallel studio 库。同时 TORQUE,Ganglia 等软件的客户端也需要安

7、装在计算节点上。3GPU 节点GPU 节点和普通的计算节点十分相像,从硬件上看,它比普通的计算节点多了 GPU 来专门做浮点运算。从软件上看,我们预安装了 CUDA。4登录节点登录节点是 HPC 集群联系外部网络或集群之间的纽带。用户需要通过它来完成用户的登录并用它来上传应用数据,开发编译程序,提交调度任务等。我们选用 x3650 M4/M5 搭载 2 块 E5-2600 v2/v3 CPU, 64GB 以上内存,2 块 300GB 的硬盘和相应的网卡或 IB 卡作为登录节点的硬件平台。开源软件方面,我们预安装多种开源的 MPI 编译库和运行库,包括MPICH、 OpenMPI、 MVAPICH2,基本上涵盖了市面上所有最通用的MPI 开源库。用户也可以选装 Intel 公司的 Intel Parallel studio 库。我们同时预安装了 GNU 编译器作为最基本的编译环境。当然,TORQUE、 Ganglia 等客户端也需要安装在登录节点上。5存储节点(I/O 节点)存储节点为整个 HPC 集群提供了分布式文件系统服务。用户通常会在存储节点上连接一个或多个外置存储设备,以保证 HPC 的数据安全和容量。我们选用一台 x3650 M4/M5 搭载 2 块 E5-2600 v2/v3 CPU, 64GB以上内

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 职业教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号