探寻多核心cpu进化与发展

上传人:kms****20 文档编号:37481201 上传时间:2018-04-17 格式:DOC 页数:13 大小:1MB
返回 下载 相关 举报
探寻多核心cpu进化与发展_第1页
第1页 / 共13页
探寻多核心cpu进化与发展_第2页
第2页 / 共13页
探寻多核心cpu进化与发展_第3页
第3页 / 共13页
探寻多核心cpu进化与发展_第4页
第4页 / 共13页
探寻多核心cpu进化与发展_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《探寻多核心cpu进化与发展》由会员分享,可在线阅读,更多相关《探寻多核心cpu进化与发展(13页珍藏版)》请在金锄头文库上搜索。

1、要想提高 CPU 的运算能力,有两种途径:一种是提高每一个运算部件的效率,制造出 更强大的核心,以质取胜;另一种是增加运算部件的数量,在 CPU 内放置更多的核心,以 量取胜。这两种思路,引领着通用 CPU 在几十年的发展道路上快速成长,它们为了提升运 算能力这个同样的目标,又互相支撑、促进和竞争,同时衍生出更多富有创新价值的设 计探寻多核心探寻多核心 CPU 进化与发展进化与发展作者: Frame选择更多的核心,还是更强的核心,已经不只是用户的任务,而成为整个 CPU 业界关 注的焦点。在传统思路的基础上,我们也看到了越来越多的架构革新。对用户来说,采用 哪种方式提升性能并不重要,因为对于运

2、算能力增强的渴望,是永无止境的。站在应用的 角度上讲,CPU 用户需要更强大的处理能力,制造商在相同成本上提供更出色的性能,就 能获得市场。以性能价格比来衡量一套系统或对比多套系统,是永远没有错的。 下文正是根据不同厂商提供的不同产品,为大家带来更多思想上的启示,让大家更明 确地认识和选择适合自己的 CPU 产品。一、更多的核心一、更多的核心 本世纪初,Intel 明确表示,多核心 CPU 解决方案是摩尔定律发展的必然产物。Intel 反复表明着自己的鲜明观点:主频不变的情况下,从单核增加到多核,功耗增加是线性的, 更容易控制,摩尔定律晶体管增加的趋势完全可以转换到集成多核心上来。同时 AMD

3、 也 在努力着,花费巨大代价设计出原生多核特别是原生 4 核,以及 AMD 努力推广,都表明 了它鲜明的立场与发展方向。在各个市场层面,IBM 与 SUN,Intel 和 AMD,还有更多厂 商,无一例外都在积极实践着多核心 CPU 的制造和应用。在桌面级市场上,多核心 CPU 同样正在以惊人的速度普及。 毋庸置疑,以多核心作为未来 CPU 的发展趋势是明智之举。但就目前的发展水平和市 场情况来看,多核心 CPU 正在面临种种考验和压力,多核之路的确坎坷不平。1、 设计思想设计思想 这里提及的多核心,实际上是我们现在能够看到实际产品的对等多核心 CPU,如 Athlon64 X2、Core 2

4、 Duo 和 Core 2 Quad 等 CPU。所谓多核心 CPU 技术,是在同一个硅晶 片(Die)上集成了多个独立物理核心,在实际工作中多颗核心协同工作,以达到性能倍增 的目的。多核心技术在应用上的优势有两个方面,一方面是为用户带来更强大的计算性能,更重要的一方面则是可满足用户同时进行多任务处理和多任务计算环境的要求。单核心 CPU 在面对多个任务时,必须为不同的任务分配 CPU 资源,我们可以形象理解为:单核 心 CPU 将 CPU 资源变成时间片,多个任务采用时间片轮转的方式共享资源。 面对日益增长的 CPU 主频和晶体管规模,芯片巨头 Intel 逐渐意识到:这样继续下去, 自己的

5、制造技术将不能应对迅猛增长的功耗和发热。AMD 方面,受制于较短的 CPU 流水 线和相对缓慢的工艺更新,也面临着主频难以提升的窘境。 形成鲜明对比的是,IBM 早在 2001 年成功产出了世界上第一款双核处理器 POWER 4,POWER4 处理器拥有 2 个 64 位 PowerPC 核心。应该说多核之门由 IBM 打开, Intel 与 AMD 迅速迈进,加速了整个业界的多核进程。但是多核处理器仅是解决方案的一 部分,更大的问题在于软件开发没有跟上硬件开发的进展。 2、 性能特性性能特性 在现在单线程应用广泛的情况下,程序绝大多数情况下只能使用到一个核心。这是由 于 CPU 在工作时是受

6、软件高度控制的。它要处理的问题是软件提出的,问题到了 CPU 中 变成具体线程,如果软件编写时使用单线程,它在被 CPU 执行时只能调用一个线程。多余 的那个内核和其他线程由于没有权限执行而浪费。尽管利用并行 CPU 提高总体软件性能的概念至少已经出现近 40 年了,但是在开发工 具方面,使这种方法进入商业市场的东西却非常少。可供程序员迅速开发出来的程序还是 单线程的。在广为关注的游戏编程方面,并行多线程编程是非常困难的,在桌面级多核 CPU 诞生的最初几年里,所有游戏开发商都把并行游戏编程视为噩梦。在单线程编程单线程编程软件下,我们的 CPU 普遍遇到上图这种环境。双核心 CPU 的一个核心

7、 运行系统检查和一些后台程序,另一个核心运行前台任务。这样使用似乎合理,但是我们 仔细思考后就会发现,Core1 基本是空闲的,因为后台程序在任何时刻,都只会消耗微小 的 CPU 资源。而在实际应用中,不可否认有一些并行多线程编程并行多线程编程程序对多核心做出了非常好的优化, 如上图。它们可以将自己分身,放在不同的核心上同时运行,这样提供了非常可观的性能 增益。在优化最合理的情况下,多核心 CPU 甚至可以做到性能线性增长,也就是说每增加 一个核心都能带来等同于第一个核心那样强大的性能。 3、性能指标、性能指标 针对此情况,我们必须要引入加速比的定义,才可以为大家更清楚地解释多核心 CPU 带

8、来的性能提升。加速比定义为串行算法在单 CPU 上的运行时间与并行算法在多 CPU 上 的并行运行时间之比。加速比可以告诉我们,性能是否与核心数目的增长同步。下图能够 简单表示多核心 CPU 的加速比情况。图中 P 代表性能,N 代表核心数目。正如上面所介绍,如果得到了有效的多线程优化, 性能将会基本呈线性增长,更多的核心自然带来更高的性能,用户每次增加核心数目,都 能感觉到性能的大幅度增长。而运行单线程软件时,无论使用多少个核心,性能和单核心 基本没有区别。图上图,在某专业服务器上,多 CPU 共同处理一个任务的表现,纵轴为加速比,在这 个实例中,我们可以对上文所提到的加速比概念更加明晰。由

9、于程序做出了有效优化,图 中的多 CPU 服务器性能优异。如上图,我们不能忽视,在大规模并行运算领域,增加大量的 CPU,是提高系统运算 能力的关键。这条路在今天继续发挥巨大作用,但由于应用环境不同,我们不能简单地以 大规模并行运算的发展来预测多核 CPU 的未来进程。多核心 CPU 的另外一个重要优势是 在繁多的程序压力下,能提供非常快速的响应能力。而在单核心 CPU 上,由于多个程序共 享 CPU 资源,往往造成响应不及时,如果遇到异常情况,系统可能在一段时间内由于 CPU 资源被占用而完全失去响应能力。 4、实际效能、实际效能 在对等多核心的组织形式方面,Intel 和 AMD 执行着各

10、自不同的多核架构。在 2005 年, 我们看到了 Smithfield 登场,这款被用来替换掉 Tejas 的处理器实际上是两枚 Presoctt 粘在 一同一枚管芯达成的双核方案,显然当时 Intel 把更多精力放在下一代双核心 Conroe 身上。 这时 AMD 双核心 Athlon 64 X2 架构使用了 Direct Connect Architecture,增添了“系统请求 接口”(System Request Interface,SRI)和“交叉开关”(Crossbar Switch)。它们的作用是对 两个核心的任务进行仲裁、及实现核与核之间的通信。 随后 Intel 原生的双核心

11、 Conroe 架构诞生了,它与双核心 Athlon 64 X2 的争斗一直延 续到今天。为了继续压制 AMD,Intel 在有了第一次“粘贴”的经验下,很快推出了四核 心 CPU,如下图,它的构成方式同样很简单。两颗核心封装在一个芯片上,却需要通过前 端总线并绕行北桥芯片进行通信。但图片告诉我们的不只是 Core 2 Quad 的核心构成方式,Intel 用数据证明,4 颗核心 (2 个双核 CPU)封装在一起并没有争用总线资源。如图,1333MHz 前端总线可以提供 8.5GB/s 带宽,而 Core 2 Quad 在数据密集型操作中,最多使用了其中的 5 GB/s 带宽。 AMD 方面,

12、为了应对对手的 4 核 CPU,在 Core 2 Quad 之后发布了 AMD 4X4 平台,它使 用 2 颗双核 CPU 通过 HyperTransport 总线直接通信,但由于没有封装在一个芯片上,会带 来很多麻烦。在经历了诸多磨难后,终于在 2007 年 9 月发布了迟到的“原生 4 核”CPU, 它同样使用了 Direct Connect Architecture,显著提高了多核心效率。 现在让我们看看桌面市场上,各款多核心 CPU 的表现,因为要讨论架构不同架构带来 的影响,所以我们把对比重点放在加速比加速比方面,得分会因具体 CPU 性能而异,但架构特性 会明显体现。 这里我们使用

13、的软件是 CINEBENCH 9.5,它对多核心做出了非常好的优化,而且结 果方便分析。CINEBENCH 的渲染任务可以在同一台计算机上测试多达 16 个处理器的性能, 让系统性能达到极限。CPU 型号C2D-E6300A64 X2 5000+C2D-QX6850AMD FX74Yorkfield 2.33GHz单核得分313385387457429多核得分579712123414631371加速比加速比1.851.853.193.203.20我们看到,经过优化设计的 Core 2 Duo 和 Athlon 64 X2 表现优秀,形象地说: 1+1=1.85,这个加速幅度是比较大的,达到了较

14、高的利用率。Core 2 Quad 虽然没有争用系 统总线资源,但是由于核心的交换效率和交换延迟,和两个 CPU 分置的 AMD 4X4 平台基 本相当。AMD FX74 由于采用的高效的互连总线,加速比让我们满意,但两颗 CPU 的功 耗和平台成本总体高于 Core 2 Quad。Intel 的 45 纳米 Penryn 家族 Yorkfield 仍然使用了两 个双核 CPU 使用前端总线连接的形式,在芯片组的支持下,达到了 3.20 的加速比。我们 没有获得准确的原生四核设计的 AMD K10 Barcelona 系列得分,但它的加速比应该高于使 用 HyperTransport 总线连接

15、的 AMD 4X4 平台。二、更强的核心二、更强的核心 单核 CPU 是否走到了尽头?广大的用户是否只能购买更多的核心,并期待得到完美的 优化,才能得到满意的性能?线性增长的不仅是性能,还有功耗和发热,谁来为这些“副产 品”买单?1、设计思想、设计思想向着性能增长这同一个目标,更多芯片厂商做出了不懈探索。为了证明更强的核心仍 然是我们追求的重要目标,打开多核心 CPU 之门的 IBM,做出了近乎于背道而驰的举动 新一代高性能芯片 POWER 6,维持上一代芯片双核心设计,而增强了单个核心的性能。IBM POWER 6 处理器,继续驻足双核,但是重新擎起性能的“杀手锏”频率。 据 IBM 介绍,

16、伴随芯片主频的提升,散热问题会变得越来越严重,一方面这将消耗更多的 电能,另一方面,散热问题也会限制芯片的制造材质。这个观点已被业界一致认同,并为 多核心 CPU 做了强劲的催化剂,但 POWER 6 告诉我们,更强大的核心性能完全有待挖掘, 应用新技术和新思路,我们可以让单个核心继续高速发展。 2、性能特性、性能特性对于竞争对手对更多线程处理能力的追求,IBM 有不同看法,多线程技术虽可提高同 一时间内并行处理任务的效率和能力,但是却需要软件开发商提供相关软件的支持。以 IBM AS400 来说,早在 1995 年就实现了双线程,但是 IBM 当时在改造支持双线程的系统 软件上花了很多功夫。 在运算性能需求更多的商业领域,目前很多企业的应用却还非常需要单线程技术,单 线程编程的软件仍然占到绝大多数。在这类应用中,如果提高了 CPU 的核心频率,将给用 户带来非常实际立竿见影的性能提升。在这

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号