北京航空航天大学-高性能计算与云计算——支撑与融合

上传人:ji****72 文档编号:45813199 上传时间:2018-06-19 格式:PDF 页数:16 大小:1.59MB
返回 下载 相关 举报
北京航空航天大学-高性能计算与云计算——支撑与融合_第1页
第1页 / 共16页
北京航空航天大学-高性能计算与云计算——支撑与融合_第2页
第2页 / 共16页
北京航空航天大学-高性能计算与云计算——支撑与融合_第3页
第3页 / 共16页
北京航空航天大学-高性能计算与云计算——支撑与融合_第4页
第4页 / 共16页
北京航空航天大学-高性能计算与云计算——支撑与融合_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《北京航空航天大学-高性能计算与云计算——支撑与融合》由会员分享,可在线阅读,更多相关《北京航空航天大学-高性能计算与云计算——支撑与融合(16页珍藏版)》请在金锄头文库上搜索。

1、高性能计算与云计算高性能计算与云计算 -支撑与融合 支撑与融合 刘刘 轶轶 北京航空航天大学计算机学院北京航空航天大学计算机学院 2014,5 高性能计算(High performance computing)已有 几十年的发展历史 又称为超级计算(Supercomputing) 并行是云计算核心系统的重要特征 分布式系统架构、互连网络等 并行编程 任务调度 负载均衡 。 并行计算技术对云计算形成了重要支撑 并行计算技术对云计算形成了重要支撑 诸多高性能计算领域的技术被应用在云计算 GPU图像/音频/视频的实时处理GPUGPU云计算应用例:加速部件在云计算中的应用 2880个流处理核 12GB

2、内存 单精度浮点性能:4.29TFlops 双精度浮点性能:1.43TFlops Nvidia Tesla K40 高性能计算机的“十年千倍”增长速度 性能增长高于处理器性能增长速度 系统规模持续增大 体系结构的改进:如近年来的异构/混合体系结构 TOP500 性能增长曲线性能增长曲线 超级计算机正在向Exa-scale迈进 目前最快:天河2号 峰值性能:55PetaFlops 19000个计算节点 功耗17.8MW 排 名 地点 系统/制造商 处理器 核数 Rmax (TFlops) Rpeak (TFlops) Power (KW) 1 中国 Tianhe-2 / NUDT Intel X

3、eon + Phi 3120000 33863 54902 17808 2 美国 Titan / Cray Inc. AMD Opteron + K20 560640 17590 27112 8209 3 美国 Sequoia / IBM BlueGene IBM Power 1572864 16324 20132 7890 4 日本 K / Fujitsu Sparc 705024 10510 11280 12659 5 美国 Mira / IBM BlueGene IBM Power 786432 8162 10066 3945 6 瑞士 Piz Daint / Cray Inc. Int

4、el Xeon + K20 115984 6271 7788 2325 7 美国 Stampede / PowerEdge Intel Xeon + Phi 462462 5168 8520 4510 8 德国 JUQUEEN / IBM BlueGene IBM Power 458752 5009 5872 2301 9 美国 Vulcan / IBM BlueGene IBM Power 393216 4293 5033 1972 10 德国 SuperMUC / iDataPlex Intel Xeon 147456 2897 3185 3422 2013年年11月月Top500排名前排

5、名前10的超级计算机的超级计算机(http:/www.top500.org) 预计预计E级系统在级系统在58年内出现年内出现 E级计算的挑战性问题:3P+1R 功耗功耗(Power) 性能性能(Performance)/体系结构 体系结构 可编程性可编程性(Programmability) 可靠性可靠性(Resilience) 大型云计算系统/云数据中心面临类似的问题 E级计算的挑战性问题:功耗(Power) 如何将E级系统功耗控制在可接受范围内? 过高的功耗将使运行成本过高,散热困难,可靠性变差 根据美、日、欧等国目标,E级系统功耗上限20MW, 即:性能功耗比 500GFlops/W 目前

6、最好:45GFlops/W (规模有限,TOP500第311位) 目前TOP500排名前十机器 3.5GFlops/W 与目标相差12个数量级 低功耗技术 低功耗器件和部件 异构计算机体系结构 冷却技术 软件低功耗管控及调度 E级计算的挑战性问题:性能(performance)/体系结构 达到E级计算性能的系统结构是怎样的? 处理器向众核方向发展 异构/混合系统结构在过去几年中取得了较大成功 目前TOP500排名前十的机器中有四台使用了加速部件 固有缺点:可编程性较差 同构 vs. 异构/混合:各有优缺点、长期共存 新型半导体及器件技术可能推动体系结构的创新 3D堆叠技术 可单片内集成众核处理

7、器、加速器、互连网络 非易失存储器的大量使用 自旋电子器件 E级计算的挑战性问题:可靠性(Resilience) 如何保证超大规模系统稳定、可靠运行 预计E级系统规模节点个数:1万10万 10PF规模系统的MTBF平均无故障工作时间 5小时 对故障检测、诊断、恢复技术提出了更高的要求 现有的Checkpoint软件故障恢复技术也面临挑战 海量节点、海量内存 E级计算的挑战性问题:可编程性(Programmability) 众核处理器将是E级系统的首选 数百核上千核处理器 预计E级系统中处理器核个数:千万量级 超高的并行度给并行算法及编程带来挑战 算法设计:能否达到如此高的并行度? 并行编程:如

8、何表示如此高的并行度? 程序调试:出错场景如何重现、编程错误如何定位? 还将与系统可靠性问题交织 性能调优 异构/混合体系结构将使编程问题更为复杂 高性能计算与云计算技术既有共性,又有各自特点 两种技术相互借鉴、相互融合 趋势一:基于云平台的高性能计算(HPC in cloud) 趋势二:网格计算借鉴云计算服务模式 高性能计算机的使用方法与20年前几乎一样 计费方式计费方式:以以CPU核核 小时为计费单位小时为计费单位 与所用计算软件相关与所用计算软件相关 MPI编写并行程序 编写并行程序 提交作业提交作业,进入作业队列进入作业队列,等待调度执行 等待调度执行 远程登录系统远程登录系统,命令行

9、操作界面 命令行操作界面 查看输出结果文件 查看输出结果文件 HPC in cloud 不是所有的高性能计算用户都需要超大规模计算 很多用户/应用属于中小规模 数十数百处理器 在云平台上进行高性能计算对部分用户有吸引力 硬软件资源可按需定制和弹性增减 无须长时间且难以预见地等待 人机交互更为直观便捷 网格计算(Grid computing) ? 基于云计算的应用服务环境 云计算已形成较为成熟的业务模式 以服务为中心 资源按需定制和计费 借鉴以服务为中心,按需定制和计费的业务模式 专业计算软件以服务形式供用户使用(相当于SaaS) 用户无需购买价格高昂的专业计算软件 仅在需要时付费使用软件服务 谢 谢!

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号