对于Intel和AMD这样的通用型处理器厂商而言

上传人:206****923 文档编号:41597154 上传时间:2018-05-30 格式:DOC 页数:9 大小:526KB
返回 下载 相关 举报
对于Intel和AMD这样的通用型处理器厂商而言_第1页
第1页 / 共9页
对于Intel和AMD这样的通用型处理器厂商而言_第2页
第2页 / 共9页
对于Intel和AMD这样的通用型处理器厂商而言_第3页
第3页 / 共9页
对于Intel和AMD这样的通用型处理器厂商而言_第4页
第4页 / 共9页
对于Intel和AMD这样的通用型处理器厂商而言_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《对于Intel和AMD这样的通用型处理器厂商而言》由会员分享,可在线阅读,更多相关《对于Intel和AMD这样的通用型处理器厂商而言(9页珍藏版)》请在金锄头文库上搜索。

1、 对于 Intel 和 AMD 这样的通用型处理器厂商而言,既要考虑台式机、笔记本等个人用户的市场需求,也需要考虑服务器市场的需求。 前言对于 Intel 和 AMD 这样的通用型处理器厂商而言,既要考虑台式机、笔记本等个人用户的市场需求,也需要考虑服务器市场的需求。因此,为了避免设计、生产和成本上的重复,就有必要设计出一套“放之四海皆准”的处理器微架构。AMD 由 K7 向 K8 迈进,便是为了主攻服务器市场,K8 放弃了 K7 的共享式前端总线架构,同时在继承 K7 单核架构的基础上进行了有力的内部改良,获得了不小的成功。然而 K10 由于在单核执行效率上不思进取,因此在单处理器市场被对手

2、的 Core 微架构打得节节败退。而 Intel 的 Core 微架构也并非无懈可击,众所周知,Core 微架构源于笔记本平台,虽然单处理器效能强劲,同时又具备良好的省电性能,因此受到单机和笔记本用户的青睐。但由于一直采用老旧的前端总线来连接多处理器,因此在以多处理器为主要诉求的服务器市场就显得有些被动。为了改变这种状况,重新在多处理器服务器市场上站稳脚跟。Intel 终于放弃了前端总线结构,拿出了新一代集成了内存控制器和 QPI 点对点连接的微架构。与此同时,为了兼顾到桌面与笔记本市场,Corei7(酷睿 i7)也对微内核内部架构进行了增强和调整。而对超频者而言,这些较大的改动,也使 Cor

3、ei7的超频体验变得与过去超频酷睿 2 有很大的不同!幸运的是,我们在 Core i7 正式发布不久,便拿到了一块 Core i7 EE965 处理器(至尊版)和IntelDX580SO 主板。以下,便与大家共同体验 Core i7 的风采!文章共分为三个部分:第一部分详细地介绍了 Core i7 在系统架构与内部架构上的变化;第二部分则通过实际超频,介绍了 Core i7 在超频方法上的变化;第三部分则测试了默认状态下的 Core i7 系统的性能。过去,Intel 处理器只能使用并行的前端总线通过北桥与外界交流,这种总线依然采用老旧的 AGTL+信号技术。不但总线频率难以提高,同时也容易在

4、多处理器场合引起处理器北桥内存的通路,由于信息传输过于繁忙而阻塞。更糟的是由于需要经过北桥访问内存,因此内存读写的延迟较大。 Corei7 中则将处理器分为内核外核两部分,内核部分包含执行核心及其专属的一级、二级缓存,外核部分则包含共享式三级缓存、集成的内存控制器 IMC、QPI 接口以及功耗、频率控制部分。集成的内存控制器将直接与专署的内存交换数据,而由于北桥中不再含内存控制器,所以原来 MCH(MemoryControlHub)的名称也改为 IOH。而 QPI 接口则替代前端总线来与其它处理器和北桥进行连接。 新集成的内存控制器将支持最大三通道配置的 DDR3 内存子系统,显著减小内存传输

5、延迟,并且比原有的双通道配置增加最大高达 3 倍的传输带宽! 而另外一个接口:QPI 传输带宽方面,我们将 Corei7 的 QPI 与酷睿 2 的并行前端总线、以及K8、K10 的 Hyperstransport 接口进行了比较,如下表: 经过这种设计,不但大大减小了内存延迟,而且也充分缓解了多处理器场合下总线带宽不足的情况。再配合高效执行的内核,不论对于桌面、服务器系统,都有重大的意义。 同时,由于采用内外核的模块式设计,因此可伸缩性十足,可以根据需要增减 QPI 的数量,比如我们手上的这颗 Bloomfield 核心 Corei7EE-965 便有 1 个 QPI 接口,而工作站、服务器

6、领域的 Bloomfield-EX核心则会有 2 个 QPI 接口。有关 Corei7 可能派生的各种型号,在我们以往的这篇Nehalem 规格总结与处理器实物展示中,已经对基于 Nehalem 的四种变型作了介绍,需要了解的朋友可以点击链接查看。加入共享式三级缓存另外,与上一代处理器有明显不同的地方,是在 Corei7 的缓存设计上。在上一代酷睿 2 处理器中,采用的是各个核心独享一级缓存,共享二级缓存的设计方案。而在 Corei7 上则改变为一、二级缓存独享,三级缓存共享的设计方案。 容量方面,独享的一级指令、数据缓存仍与酷睿 2 一样,为 32/32KB,读写延迟比酷睿 2 的 3 周期

7、稍慢,约为 4 周期,不过 Corei7 更优秀的内存读写延迟可以较好地弥补;二级缓存部分,每个核心独享256KB 容量,读写延迟约 12 周期。三级缓存部分则为共享式,容量 8MB,读写延迟约 30-40 周期。 虽然都使用了三级共享式缓存,但与 AMD 的 K10 有所不同的是,Corei7 的三级缓存采用inclusive(内含式)设计。也就是说在各个核心的一级、二级缓存中的数据,在三级缓存中都会进行保存。而 AMD 的 K10 则采用 Mostlyexclusive(非内含式)设计,一级、二级缓存中的数据并不常在三级缓存中进行备份。 以上是我们使用 Everest 对 Corei7EE

8、-965 所进行的缓存-内存子系统带宽、延迟的测试,由测试结果可见,内存部分的带宽都得到显著提升,延迟明显地减少。 除了新的三级缓存之外,用于快速检索内存的 TLB 缓存部分也做了大量改良,如增加缓存容量、采取真正的两级式结构,增加用于 SMT 技术的虚处理器 ID 标志位等措施。充分保证增加了三级缓存,并采用 SMT 技术后仍能保证核心的高效运转。SMT 技术重新回归在奔腾 4 时代,Intel 便推出了超线程技术,这项技术允许将一个真实处理器核心模拟为两个虚拟核心,这样在理想的条件下,处理互不冲突的多线程任务时,便能充分利用每个核心中的空闲执行单元。 但是在酷睿核心中,Intel 并没有继

9、续采用这项技术。如今发展到 Corei7,Intel 又重新开始采用超线程技术的升级版:SMT。 四核心的 Core i7EE-965 开启 SMT 技术后使用任务管理器观察可以发现系统中增加了 4 个虚拟核心。在 Corei7 上,由于处理器具备更高的内存带宽和更大的缓存容量,同时内核部分又根据 SMT 的特点进行了增强设计,因此应用起 SMT 来将更加得心应手,更容易获得性能的提升。根据测试,开启 SMT 技术后的 Corei7 性能提升可在 734%左右。内核微架构也得到进一步强化采用新的微架构、增加缓存容量并启用 SMT 技术,虽然可以起到显著增强多处理器执行效能的作用。但酷睿 2 当

10、年受欢迎的场面告诉我们,如果一款处理器的设计过多考虑多处理器执行效能,而不能在对游戏等个人应用更有意义的单核效率上比过去有明显的提升,那么它将难以避免的面临尴尬的境地。有此前车之鉴,在保留 Core 微架构总体上不变的基础上,除了增加三级缓存,并对 TLB 结构进行改良之外,Intel 还在 Corei7 中对影响单核效能的内部微架构进行了许多有力的改良,现简要概述如下:1、前端的分支预测机构方面,改用两级式分支目标缓存(BTB)结构,并改良了用于子程序调用时快速查找返回地址的返回地址栈(RSB)机构。此外,Corei7 还将扩容后的循环流检测器(LSD)首次放到了解码器的后方(在酷睿 2 中

11、 LSD 被放在解码器前面),这样在性能和耗电方面都有实际意义; 2、前端的指令解码部分,Corei7 继承并发展了酷睿中的宏融合技术,现在宏融合技术在 32 位/64 位两种模式都可以发挥作用,并可以将更多的指令融合为一条微操作,无形中增大了解码带宽; 3、乱序执行引擎的指令调度部分,指令队列缓存、载定序缓存 ROB、保留站 RS 等部件的容量比酷睿都得到进一步扩展,并且根据 SMT 的需要进行了一些调整; 4、此外,为了改善存储、网络文件和字符串处理的效能,Core i7 中还增加了由 7 条新指令组成的SSE4.2 扩展指令集。 这些改良不但有利于增强处理器的单核效率,而且还兼顾了 SM

12、T 的需求,确保 Core i7 立于不败之地。一体化的频率功率控制最后,在 Core i7 的外核中集成了 PCU 单元,可以单独控制内核各个核心的频率、电压,并且还可以负责监控核心温度。 将供电控制放在内核中,再配合新 COMS 材料的使用,使 Corei7 可以进一步减小休眠状态下的漏电流。而频率控制功能的加入,则使各核的频率与功耗控制更加灵活,可以根据实际的运行状况配合操作系统进行更精确的电源管理,做到既节省了电能,又不至于使性能过分降低。 而由此设计出智能加速技术(Intel Turbo Boost Technolgy,也就是 TurboMode)技术,则在省电高效的基础上,又大大增

13、加了 Corei7 的可玩性。智能加速技术是在 PCU 和 Intel 旧有的 Speedstep 变频省电这两项技术的基础上产生的一种新技术。在 BIOS 中打开 Speedstep 和 Turbomode 之后,我们可以自由地设定各个核心的倍频数。新架构带来新玩法:Core i7 超频小试(1)经过前面的说明,我们已经对 Corei7 的单核多核效率,以及其全新的微架构优势有了一定的了解。但多数高端玩家所关心的 Corei7 可超性,大家心中恐怕依然打着大大的问号。历史原因,过去 AMD 的K7 到 K8 再到 K10,由于内存控制器的加入而使可超性逐年下降,大家对此都已经有了较深的印象,

14、那么集成了内存控制器的 Corei7 会不会也遇到同样的问题呢?可以说 Corei7 的超频比过去酷睿 2 的超频有了较大的变化。由于集成内存控制器和 QPI 接口的加入,再加上 TurboMode 的引入,使 Corei7 的超频更具难度与趣味性。我们首先把超频过程中需要涉及到的频率与电压总结如下: 如上图所示,Corei7 中虽然具备多种部件,但它们的频率都是以 BCLK 频率(有点类似与过去的前端总线频率)也就是 133MHz 为基准生成的。 在 IntelDX58SO 主板上,BCLK 频率基准由 133-250 可调。CPU 核心频率则可使用 TurboMode 技术由 5-30 倍

15、频进行不同调节(非 EE 版可调倍频可能会有所缩小)。而 IOH 中包含的内存控制器频率则由BCLK 乘 12-30 可调倍频而形成。DDR3 工作频率则有 BCLKx6/8/10/12 四个档次可调。而 IOH 中的 QPI接口频率,有 BCLKx18/22/24 三档可调。而非至尊版的 Core i7 如 940/920 等,则可能无法随意调高处理器的倍频,只能调节 QPI 与 DDR3 内存的倍频。这里需要注意的是 TurboMode 技术是以 Speedstep 技术为基础的,因此要想启用 TurboMode 的设定,不仅要设置好 TueboMode 本身的设定,而且还要打开 Spee

16、dstep 功能,才能正常进入 TurboMode 模式。电压调节方面,除了 CPU 核心电压和内存电压之外,IOH 电压相当于过去的北桥电压,而 QPI 接口电压也是新增的可调选项。新架构带来新玩法:Core i7 超频小试(2)进入实际的 BIOS 设置过程,我们首先尝试不调节外频,而只对倍频进行调节。因此首先是处理器倍频的设置说明。简单地说,在 Corei7EE-965 上,由于 MaximumNon-TurboRatio 最大只能调节到 24 倍频。因此要达到更高的倍频必需注意调节以下四处:首先增加处理器的电压,推荐增加到 1.525V 左右;接着打开 Turbo Mode 并设置好需要超的倍频数:再将 Speedstep 功能打开,如果以超频为目的,最好将这里其它的无关选项都关闭,如果以省电为目的,则保留原设置即可;最后,如果以超频为目的,那么推荐将 CPUIdleMode 设为“HighPerformance”,这样能避免超频时的不稳定;如果以节省电能为目的,那么推荐将其设为“LowPower”,再进入操作系统中的电源管理中设置好省电模式即可。只超倍频的结果,是

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号