IBM Power 7处理器浅析_终端和服务器_基础信息化_4993

上传人:飞*** 文档编号:43526564 上传时间:2018-06-06 格式:DOC 页数:14 大小:48.50KB
返回 下载 相关 举报
IBM Power 7处理器浅析_终端和服务器_基础信息化_4993_第1页
第1页 / 共14页
IBM Power 7处理器浅析_终端和服务器_基础信息化_4993_第2页
第2页 / 共14页
IBM Power 7处理器浅析_终端和服务器_基础信息化_4993_第3页
第3页 / 共14页
IBM Power 7处理器浅析_终端和服务器_基础信息化_4993_第4页
第4页 / 共14页
IBM Power 7处理器浅析_终端和服务器_基础信息化_4993_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《IBM Power 7处理器浅析_终端和服务器_基础信息化_4993》由会员分享,可在线阅读,更多相关《IBM Power 7处理器浅析_终端和服务器_基础信息化_4993(14页珍藏版)》请在金锄头文库上搜索。

1、IBM Power 7 处理器浅析_终端和服务器_基础信息化毫不夸张地说,Power 7 处理器的问世,让 IBM 重新夺回了高性能计算领 域的制高点,以恐怖的性能和突破性的规格将 Intel、AMD 远远甩开。究竟蓝色 巨人给 Power 7 注入了什么样的魔法?现在就让我们一起探个究竟。 高性能计算再起风云高性能计算再起风云 短短几年时间,高性能计算领域就已经发生了翻天覆地的变化先是 SUN 在 SPARC 处理器上开发不力,逐步淡出。然后是 Intel 至强和 AMD 皓龙处理器 的低价渗透。就在 2009 年,NVIDIA 甚至试图借助 GPU 架构的 Tesla 进军高性能计算领 域

2、就在我们以为高性能计算领域也会像台式机、服务器领域那样回归 Intel、AMD、NVIDIA 三家斗法之时,盟主 IBM 终于按耐不住,在 2010 年 2 月 8 日拿出了密谋许久的 Power 7 处理器。 冲击千万亿次计算冲击千万亿次计算 你可别以为 Power 7 处理器会像其他几家的 CPU 和 GPU 那样,一年就能够 换代,事实上关于 Power 7 的研发从 2006 年就开始了。2006 年 11 月,IBM 赢 得了美国国防高级研究计划署(DARPA)研发每秒千万亿次计算(Petascale)超级电脑的研发合同。合同中规定,在 2010 年底 IBM 必须拿出达到千万亿次运

3、算规 模的超级计算机供 DARPA 使用。在合同中还规定,这样的计算机架构,必须能 在日后实现商业化和规模量产化。其中 IBM 还提出,新的架构要完全符合 PERCS(Productive,Easy-to-use,Reliable Computer System)即高效易用可 靠运算架构。在这个价值 2.4 亿美元的项目中,IBM 当时就预计交付美国国防 高级研究计划署的电脑将会使用 Power 7 处理器、AIX 操作系统以及通用并行 文件存储系统。从 2006 年 11 月开始,IBM 就和美国国防高级研究计划署就新 的处理器架构进行合作研发,目标很简单让千万亿次计算触手可及。如果你经常看

4、到 Intel 和 NVIDIA 的宣传,应该还记得 Intel 的 80 核处理 器计划,目标是实现单芯片上万亿次计算(Terascale)级别的计算。事实上在高 性能计算领域,几乎所有厂商都在为万亿次计算努力。而 2008 年 IBM 为美国国 家核能安全管理部设计的 Roadrunner(走鹃)超级计算机,才首次达到 1.026PetaFLOPS(每秒千万亿次浮点运算),成为人类首部达到千万亿次计算级 别的电脑。在当时,IBM Roadrunner 动用了 6912 颗 AMD 双内核 Opteron 处理 器和 12960 颗 IBM PowerXCell 8i 处理器,并且配备了 5

5、1.8TB 内存,耗资 1.33 亿美元。而 Roadrunner 之所以如此庞大,究其原因就在于单个处理器所 提供的运算能力相当有限双内核 Opteron 处理器只有 5.2GFLOPS 浮点运算能 力,IBM PowerXcell 8i 处理器的浮点运算能力为 102.4GFLOPS。而 NVIDIA 的 高性能运算卡 Tesla C2070 也只能提供 630GFLOPS 浮点运算能力。IBM Roadrunner 超级计算机毫无疑问,要降低超级电脑跨入 Petascale 的门槛,提升 CPU 的峰值浮点 运算能力是不二的法门。NVIDIA、AMD 等图形卡制造商力挺的异构计算,虽然

6、能够达到更高的峰值浮点运算,但在交付使用后往往需要改写大量的代码,才 能完全发挥异构体系的力量。而用传统 CPU 架构堆砌起来的超级计算机,显然 更符合 IBM PERCS 结构。Power 7 CPU根据 IBM 的数据,Power 7 将会提供最大 264.96GFlops 的峰值浮点运算能 力,将当今市场上的一切 CPU 都远远的抛在身后。Power 7 即便面对 NVIDIA/AMD 的 GPU 架构处理器也不遑多让。更让人惊讶的是,IBM 在 Power 7 上引入了智能核心、智能线程、智能缓存、智能功耗和智能内存技术,解决了 困扰当今 PC 许久的运行效率与功耗等至关重要的问题。打

7、造史上最大打造史上最大 CPUCPU 如今热卖的 Intel Core i7 处理器采用了 45nm 制程工艺,芯片面积为 270mm2。而同样采用 45nm 工艺的 Power 7 处理器,芯片面积却高达 567mm2 是 Intel Core i7 的两倍。究竟 IBM 用 567mm2 的核心和 12 亿个晶体管干了些 什么?Power 7 处理器将会有 4、6、8 内核三种规格。其中每个内核都能实现 4 路同步并发线程。这意味着在 8 内核 Power 7 中,可以并行执行 32 条线程! 而我们熟悉的 Core i7 处理器每个内核通过超线程技术只能提供两个并发线程。Power 7

8、CPU 内核除此之外,在 Power 7 每个内核中都拥有 12 个执行单元。每个执行单元包 含 2 个整数运算单元、2 个存储/读取单元、4 个双精度浮点运算单元、1 个支 持 VSX 的矢量执行单元、1 个十进制浮点运算单元、1 个分支单元、1 个寄存器 单元。在 Power 7 CPU 中每个内核都有 32KB 一级指令和数据缓存、256KB 二级 缓存。所有核心共享 32MB eDRAM 三级缓存。Power 7 初期频率就能达到 3GHz4.14GHz,并内置了两个 4 通道 DDR3 内存控制器,以提供最大 100GB/s 的内存带宽。值得一提的是,IBM Power 7 中三级缓

9、存是用 eDRAM 实现的,而 非传统 CPU 中的 SRAM。和 SRAM 相比,eDRAM 能极大的节省晶体管数量和降低芯 片面积,并且提供直逼 SRAM 的传输带宽在微软 XBox 360 游戏机的 GPU 上, eDRAM 就轻松提供了 256GB/s 的传输率。由于 eDRAM 的引入,Power 7 在搭载 32MB 三级缓存时芯片面积也没有过度增长。和前辈 Power 6 相比,Power 7 的 主频已经从 5GHz 降低到了 4.14GHz。但由于 Power 7 拥有更多的内核、更强的 并发多线程能力,所以在性能上 Power 7 可以实现倍数的跨越。 智能为王智能为王 更

10、聪明的更聪明的 PowerPower 7 7 Power 7 是一颗聪明的处理器,IBM 工程师为它赋予了更多的智能技术,在 性能、功耗上取得更大的突破。能自动优化核心能自动优化核心 在 Intel 推出 Core i7 CPU 的时候,TurboBoost 功能成了产品重要卖点不 断宣传。Intel 的 TurboBoost 技术可以让 CPU 根据负载,在不同的内核负载下, 自动提升单核频率以及整体频率以实现更快的运行速度。在 Power 7 上,IBM 更进一步,提出了智能核心的概念。Power 7 处理器拥有最多 8 个内核,因此 IBM 为 Power 7 设计了 TurboCore

11、 和 MaxCore 两大运行模式。TurboCore 模式可 以对数据库或工作负载进行高度优化,同时采用 4 个内核运行,并把芯片中所 有 8 个内核大部分资源放到 4 个运行的内核中,以提供更大的缓存和内存带宽, 提升时钟频率,提高单核性能。Power 7 CPU 内核架构当不采用 TurboCore 模式时,所有 Power 7 处理器在 MaxCore 模式下,拥 有多达 8 内核、每内核 4 线程,共计 32 线程的并行处理能力。你千万别以为智 能内核只是简单的超频、关闭打开内核那么容易。在 TurboCore 模式下,虽然 有 4 个内核会被关闭,但这些内核所占据的缓存和各种执行资

12、源都会被释放, 由工作中的 4 个内核统一调度,以实现资源利用的最大化。夸张的夸张的 8 8 核核 3232 线程并行处理能力线程并行处理能力 在 Power 7 中,IBM 引入的 SMT4 技术可以在单一内核上实现 4 路同步多线 程功能。这样一次就能吃下 4 条线程,极大地提升并行能力。但是所谓的 SMT 同步多线程,并不是真正的多内核多线程。只是通过不断的状态切换,以提升内核利用率的一种方式。这样的设计在 并行度很高的应用中能获得立竿见影的效果。但在数据库等应用中往往会出现 性能下降。过去我们大多采用手动打开、关闭 SMT 同步多线程的方法“因地制 宜”。Power 7 提供 4 路同

13、步多线程功能在 Power 7 上,IBM 引入了智能线程(Intelligent Threads),可以根据工 作负载要求进行设置不同的多线程模式,系统可以自动选择,也可以由管理员 进行手动设置。这样就能在并发线程和执行效率中获得良好的平衡。必须指出 的是,智能线程功能是需要操作系统支持的。只有在 2010 年 4 月问世的 IBM AIX 6.1 TL05 操作系统支持此功能在现阶段的 Linux 等操作系统中,Power 7 的 SMT 功能将完全无法使用。这些操作系统会把 Power 7 当作 8 内核普通处 理器进行管理。更智能的缓存和内存控制器更智能的缓存和内存控制器 从自动控制内

14、核开关,到自动判断 SMT 功能是否打开,打开多少。在处理 器运算能力调度方面,Power 7 已经技压群雄。不过,IBM 似乎还不满足于运算 能力的灵活调度,他们想让缓存和内存系统也变得更为智能高效。Power 7 处理器的 L3 缓存和 Intel Core i7 有许多相似之处 例如每个 内核都在 L3 缓存中有自己的高速本地 L3 缓存区(Fast Local Region of L3 Cache,FLR-L3)。但每个内核之间,却依然能通过 L3 缓存共享数据。根据 IBM 的说法,Power 7 32MB L3 Cache 中,有 4MB 缓存的速度快和延迟低,提供的 性能介乎于

15、L1 和 L2 之间,由此来确保处理器在众多内核并行工作时仍然有较 好的性能。Power 7 内存访问机制为了压倒 Intel 在 Core i7 中集成的 3 通道 DDR3 内存控制器,Power 7 干 脆直接集成了两个 4 通道 DDR3 内存控制器,这意味着每个 Power 7 处理器最多 能支持 256GB 的 DDR3 内存。在内存控制器内部,Power 7 专门设计了芯片内 DDR3 内存缓冲区。这样的设计极大地增加了每个 Power 7 内核所能管理的内存 容量,并且实现了更高级别的冗余扩展和电源管理。由于采用了 4 通道内存设 计,所以 Power 7 已经取消了对单根低容

16、量 DDR3 内存的支持。在 Power 7 上 用户最少需要安装两条 4GB DDR3 内存才能正常启动。Power 7 内存控制器值得一提的是,IBM Power 7 中引入了新的低电压差分信号传输方式,这 样让 Power 7 在支持海量内存和 8 个以上 DIMM 内存插槽时,主板布线不至于太 过复杂。强大的智能功耗管理功能强大的智能功耗管理功能 几乎所有新的 CPU 都在电源管理上狠下功夫。Power 7 也不例外。在 Power 7 上,IBM 提出了智能功耗(Intelligent Energy)的概念,并在 Power 7 中延续 了 Power 6 CPU 上大获好评的 EnergyScale 功能。Power 7 处理器内部构建的 EnergyScale 单元能不断地搜集整个电脑的功耗数据,然后将其汇报给 IBM System

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号