WIN-深入浅出多核心处理器技术.doc

上传人:s9****2 文档编号:543818089 上传时间:2023-09-03 格式:DOC 页数:11 大小:801.51KB
返回 下载 相关 举报
WIN-深入浅出多核心处理器技术.doc_第1页
第1页 / 共11页
WIN-深入浅出多核心处理器技术.doc_第2页
第2页 / 共11页
WIN-深入浅出多核心处理器技术.doc_第3页
第3页 / 共11页
WIN-深入浅出多核心处理器技术.doc_第4页
第4页 / 共11页
WIN-深入浅出多核心处理器技术.doc_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《WIN-深入浅出多核心处理器技术.doc》由会员分享,可在线阅读,更多相关《WIN-深入浅出多核心处理器技术.doc(11页珍藏版)》请在金锄头文库上搜索。

1、深入浅出多核心处理器技术 全面解析Intel Core微架构牛子敏,033143杨博,033153陈庆,033154摘要:多核处理器技术已经逐渐成为处理器发展的趋势。本文首先阐述了Intel采用多核处理器作为发展方向的原因,介绍了多核处理器的概念及特点,并以Intel Core微架构为例,详细介绍了该系列处理器的技术特点和性能。本文最后还对多核处理器的前景进行了展望。关键词:多核处理器,Intel,Core微架构一、 引 言由于近几年来,由于PC应用越来越复杂,需要越来越强大的CPU处理能力。而CPU性能提高是通过提高CPU主频和前端总线频率,以及扩大缓存来实现。提高主频对PC散热的设计是很大

2、的挑战,同时会增加成本,单核心处理器的发展已经达到一个极限。为了解决这些问题,人们提出了多核技术的概念。多核技术不但可以提高性能,而且很好地解决了功耗的问题,成为未来处理器的发展方向。由于Intel 原本寄以厚望、号称频率将提升至10GHz的 NetBurst 微架构屡遭重创,如采用90nm制造工艺的 Prescott 遭遇功耗过高、散热困难的问题,原定推出的4GHz的 Pentium 4 580被无限期推迟,而后继产品也被取消。NetBurst 微架构遭遇无法解决的功耗问题,发展受阻。与此同时,竞争对手 AMD 的 K8 处理器在性能和功耗两方面都表现良好,正在桌面和服务器平台上侵占原本属于

3、 Intel 的市场,势头迅猛。这也迫使 Intel 只能选择重新研发兼具高性能与低功耗的微架构。因此Intel选择了使用多核心架构的Core微架构作为其下一代产品。因此本文着重讨论了Intel Core微架构各方面的技术细节,这对未来处理器的发展是具有重大意义的。二、 Intel为何转向Multi-Core的开发? 其实在Intel之前,HP,IBM已经有多核处理器开发出来,例如苹果之前用的IBM POWER4处理器,只不过没有应用到桌面系统而已。此次Intel调整方向主要应该有如下三个原因。 第一,双核心技术的引入是提高处理器性能的另一个行之有效的方法。因为处理器实际性能是处理器在每个时钟

4、周期内所能处理的指令数的总量,因此增加一个内核,处理器每个时钟周期内可执行的指令数将增加一倍。在双核处理系统中,所有的任务和线程都能够使用系统中的所有资源。操作系统会安排每个处理器使用资源的顺序和使用时间,任务或者线程会在两个物理内核中并行处理。而在单个物理内核中,任务和线程在本质上还是串行处理的。因此在同等级别中双核处理器的工作效率要远远高于单核处理器。第二,引入双核心的架构还可以全面增加处理器的功能,这也是一个很重要的因素。有这么一个事实:双处理器架构的引入和微软下一代Vista操作系统将在很大程度上促进虚拟技术的发展。AMD和英特尔都坚信虚拟技术将成为下一代电脑系统的一个主要特征,而且是

5、重要特征。 第三,引入双核心架构的一个重要原因是随着单核集成度越来越大,所需要的核心电压也随之增长,而CPU功耗是和电压成立方比的,因此将导致CPU功耗会大幅度增长,散热也会成为一个很难解决的问题。综上诸个因素,双核心架构都是很有利的,这也就难怪突变方向朝双核架构大力发展。三、 对Intel Core微架构技术细节的介绍2.1 先进的65nm制程1965年,Intel公司的创建者Gordon Moore提出了一个众所周知的理论“摩尔定律”:认为集成电路密度大约每两年翻一番。在过去40年的时间里面,摩尔定律不但印证了集成电路技术的发展,而且也印证了计算机技术的发展。Intel公司在2005年开始

6、采用65nm的生产工艺,在其最新推出的双核处理器中使用的就是这种最新的生产工艺。如今的65nm的工艺与之前Intel使用的90nm工艺相比,Intel的65nm工艺沿用了90nm工艺和以往使用的很多成熟技术,比如300mm直径的晶圆(Wafer Size)、硅化镍栅极、1.2nm二氧化硅栅极电介质、低介电碳掺杂氧化物(Low-K CDO)、铜连接工艺等。除此以外,65nm工艺还拥有一些新特性:将从90nm工艺开始使用的应变硅技术升级到第二代,使得晶体管的效率更高;此外,8层金属传导层堆叠比90nm工艺的7层增加了一层,接触栅极节距也减小到220nm,使得晶体管密度进一步加大;采用更新的光刻技术

7、,以便制造出35nm宽的栅极。Intel的处理器都是由CMOS(互补金属氧化物半导体)组成的,CMOS包括N型和P型两种晶体管,由源极、栅极和漏极组成,在栅极和其他两级之间有一层栅极(绝缘)电介质。在NMOS中,载流子是带负电荷的电子,当NMOS的栅极电压高的时候,电流处于“开”的状态,电压低的时候处于“关”的状态。而PMOS的载流子是带有正电荷的空穴,开关状态与NMOS正好相反。但是随着制造工艺的进步,晶体管的体积变得越来越小,某些问题也随之而来。在130nm及以前工艺的时候,由二氧化硅制成的栅极电介质的厚度足以阻挡电子的通过,由于漏电带来的损耗功率非常小。但当制造工艺发展到90nm工艺的时

8、候,栅极电介质的厚度减少到了1.2nm,仅仅是5个原子层的厚度,由于隧道效应,电子可以从其中穿过,带来的后果就是漏电量和发热量的增加。源极与漏极之间的硅层也越来越薄,在晶体管处于“关”状态的时候产生了严重的阈下泄漏。这两种泄漏电流给晶体管增加了沉重的负担。此外,源极也在向硅基板泄漏电流。根据Intel官方网站报道的一些相关研究,如果没有任何技术措施,65nm工艺CPU漏电功率将达到100W150W,而45nm工艺的CPU仅仅阈下泄漏功率就将达到100W,总发热量足以使CPU在开机数秒钟之内烧毁。针对这一问题,Intel公司提出了如下解决方案:为了提高晶体管的工作效率,降低动态能耗,Intel在

9、90nm工艺中引入了单轴应变硅技术。其基本的思想就是减小源极与漏极之间的电阻,使得工作电流(Ion)更大,以提高晶体管的响应能力。应变硅技术在栅极氧化物层下面使用了一层极薄的单晶硅,并对其预施加张力或者压力,改变原有的晶格结构。对于NMOS来说,载流子是电子,使用高张力的氮化硅陶瓷薄膜帽,对硅晶格施加张力,加大硅原子的距离,可以让电子更方便地通过,提高Ion;对PMOS而言,载流子是空穴,使用选择性硅锗源极/漏极,可以施加压力提高空穴密度,从而加大Ion。65nm工艺依然沿用了90nm工艺的基本原理,但将应变硅技术提升为第二代,进一步提高了工作电流(Ion)和漏电电流(Ioff)之比,与90n

10、m工艺相比,使得晶体管的工作电流提升了15%,漏电电流降低了4倍。随着工艺的改进,晶体管的栅电容也有了进一步的下降。65nm工艺的栅极氧化物二氧化硅层的尺寸没有变化,仍然维持着1.2nm的厚度,但栅极长度减少为35nm,这使得栅极电容下降了大约20%,加上工作电流的提高,带来的好处是使晶体管的切换频率提高了1.4倍。在65nm工艺制程的SRAM中,Intel还引入了休眠晶体管模式来降低能耗,这一技术也将被引进65nm工艺制程的处理器核心中,减少缓存的发热量。在SRAM缓存子块上连接一个NMOS休眠晶体管,使其在空闲时进入休眠状态,可以大幅度降低SRAM和ALU(算术逻辑单元)的电流泄漏。与90

11、nm工艺中采用的体偏置技术相比,它的性能大约是后者的1100倍。除此之外,堆叠效应也能够对降低能耗有一定的贡献。多重供应电压技术也是65nm工艺降低能耗的手段之一,它可以有效降低运行功率(Active Power)。通过这些技术,65nm工艺处理器的发热量将会有不小的降低。2.2 14级指令执行管线和四组指令编码器随着当今技术的不断发展,新型体系结构设计需要考虑两方面的要素:一是合理的增加计算机系统中硬件功能的比例,使体系结构对操作系统,高级语言甚至应用软件提供更多,更好的支持;二是通过多种途径提高计算机体系结构中的并行性等级,使得凡是能并行计算和处理得问题都能并行计算和处理,使这种体系结构和

12、组成能对算法提供更多,更好得支持。而提高并行性有3种有效的途径,一是时间重叠,二是资源重复,三是资源共享。时间重叠就是要使计算机能够流水的处理数据和指令,而流水线是一把双刃剑,使用不好的话,未伤人先伤己。Intel最新发布的多核处理器在架构变化中,Core核心第一个变化就是处理器流水线缩短了-仅采用14级指令执行管线设计。此前,Northwood和Willamette核心的流水线为20级,相对于当时的PIII或者Athlon XP的10级左右的流水线来说,增长了几乎一倍。到现在市场上采用Proscott核心的PD和Celeron流水线为31级。众所周知,流水线越长,频率提升潜力越大,但是一旦分

13、支预测失败或者缓存不中的话,所耽误的延迟时间越长。如果一旦发生分支预测失败或者缓存不中的情况,Prescott核心就会有39个周期的延迟。这要比其他的架构延迟时间多得多。因此,参照现在的Pentium M和Athlon 64架构,Core新架构将采用14级流水线,可以在原来Pentium 4的基础上提升执行效率,不过想要在短期之内看到突破4GHz频率的CPU变成了一个不可能实现梦。除了执行管线有所精简外, Core多核处理器架构另一特色莫过于内建四组指令编码器,可在一个频率周期(clock cycle)内,同时编码四个x86指令。自从AMD失败的K5之后,有超过十年的时间,x86的世界从没出现

14、过四组指令编码器的设计。因x86的指令长度、格式与寻址模式都相当的紊乱,导致x86指令编码器是非常难作的东西,甚至连Intel先前的NetBurst微处理器架构,就通过导入Trace Cache存放编码后的微指令,企图替代高性能复数指令编码器,但改进并不是很明显。因此在Core微处理器架构上,Intel最后采用了四组指令编码器设计。Core多核微处理器延续先前P6与Banias微处理器架构的方式,由三组简单编码器(simple decoder)与一组复杂编码器(complex decoder)所组成的4-1-1-1结构,四组指令编码器中,仅有复杂编码器可处理最多由四个微指令所组成的复杂x86指

15、令;如果不幸碰到非常复杂的指令,复杂编码器就必须呼叫微码循序器(Microcode Sequencer),以取得微指令序列。为了配合四组编码单元,Core多核微处理器架构的指令取指单元在一个频率周期内,从第一阶指令缓存中,获取(fetch)六个x86指令至指令编码缓冲区(Instruction Queue),判定是否有符合宏指令融合的配对后,将最多五个x86指令,交派给四组指令编码器。四组指令编码器在每个频率周期中,发给(issue)保留站(Reservation Station)四个编码后的微指令,保留站再将存放的微指令交派(dispatch)给五个执行单元。执行指令数越多,意味着其处理能力

16、越强,表现出来的性能越高。2.3 多核处理器高效内存管理技术在处理器速度发展越来越快的今天,计算机的瓶颈之一就是内存与处理器速度的不匹配,导致内存存取延迟较长。Intel为了弥补缺乏整合型内存控制器、导致内存存取延迟较长的缺憾,在内存系统上花了很大的功夫。在降低Cache延迟方面有一个关键技术,称之为:Memory Disambiguation技术,即在存数和取数指令都乱序执行的情况下,保证取数指令都能取回它前面的最近一条对同一地址的存数指令所存的值。比如如果一条取数指令在一条存数指令之后且两条指令的地址相等,但取数指令先访问Cache,也要保证取数指令取回该存数指令的值。在过去,一个接连在回存指令后的加载

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号