AMD的CPU主频计算方法

资源描述

《AMD的CPU主频计算方法》由会员分享，可在线阅读，更多相关《AMD的CPU主频计算方法（5页珍藏版）》请在金锄头文库上搜索。

1、AMD 的的 CPU 主频计算方法主频计算方法计算机及软件相关知识 2009-04-09 10:38:53 阅读 565 评论 0 字号：大中小 AthlonXP 1800+的实际主频应该是 133X11=1.46GHz。自从 AMD 的 Athlon 系列处理器使用新名称AthlonXP 起，AMD 改变了以实际主频作为处理器名称的做法，而是改用了标称值，也就是所谓的 PR 值。它是以同时代的 Pentium 4 处理器的性能为参考的，所谓的 1800+就是说它的性能相当于同时代 Pentium 4 1.8GHz 处理器，至于+号嘛，稍微有点比 P4 1.8 稍微好一点的意思，商业手段，给消

2、费者一定的暗示，这很正常。最近买电脑的人很多,很多人都被 AMD 的 64 位处理器所吸引很多人问 AMD 的 CPU,型号后面跟的哪个数值是不是它的主频数.答案当然是否定的如:AMD ATHLON XP 2600+为例,2600+是 PR 值而不是主频数其计算方法如下T-bred 核心 PR 值标称规则：实际运行频率32500PR 值Barton 核心 PR 值标称规则：实际运行频率32200PR 值那么 AMD ATHLON XP 2600+的实际频率是 2083MHz如果还是算不出来直接看下面的图表好了Intel 和 AMD 的 CPU 主频计算AMD 的实际频率=（PR 值+500）2

3、/3-X（其中 X 的值 AMD 在不断调整中，一般在 0-500 之间）如 Athlon XP 2500+的实际频率=（2500+500）2/3-170=1.83GHz（166MHz11）。注：这里所说的 PR 值是指相当于同频率 InterCPU 的性能，如 Athlon XP 2500+指性能相当于 P4 2.5G。CPU 的处理性能不应该去看主频，而 INTEL 正是基于相当相当一部分人对 CPU 的不了解，采用了加长管线的做法来提高频率，从而误导了相当一部分的人盲目购买。CPU 的处理能力简单地说可以看成：实际处理能力=主频*执行效率，就拿 P4E 来说他的主频快是建立在使用了更

4、长的管线基础之上的，而主频只与每级管线的执行速度有关与执行效率无关，加长管线的好处在与每级管线的执行速度较快，但是管线越长（级数越多）执行效率越低下，AMD 的 PR 值可能会搞得大家一头雾水，但是却客观划分了与其对手想对应的处理器的能力。为什么实际频率只有 1.8G 的 AMD 2500+处理器运行速度比实际频率 2.4G的 P4-2.4B 还快？为什么采用 0.13 微米制程的 Tulatin 核心的处理器最高只能做到 1.4G，反而采用 0.18微米制程的 Willamette 核心的处理器却能轻松做到 2G？下面我们就来分析一下到底是什么原因导致以上两种“怪圈”的存在。每块 CPU

5、中都有“执行管道流水线”的存在（以下简称“管线”），管线对于 CPU 的关系就类似汽车组装线与汽车之间的关系。CPU 的管线并不是物理意义上供数据输入输出的的管路或通道，它是为了执行指令而归纳出的“下一步需要做的事情”。每一个指令的执行都必须经过相同的步骤，我们把这样的步骤称作“级”。管线中的“级”的任务包括分支下一步要执行的指令、分支数据的运算结果、分支结果的存储位置、执行运算等等最基础的 CPU 管线可以被分为 5 级： 1、取指令 2、译解指令 3、演算出操作数 4、执行指令 5、存储到高速缓存你可能会发现以上所说的 5 级的每一级的描述都非常的概括，同时如果增加一些特殊的级的话，管

6、线将会有所延长： 1、取指令 1 2、取指令 2 3、译解指令 1 4、译解指令 2 5、演算出操作数 6、分派操作 7、确定时 8、执行指令 9、存储到高速缓存 1 10、存储到高速缓存 2 无论是最基本的管线还是延长后的管线都是必须完成同样的任务：接受指令，输出运算结果。两者之间的不同是：前者只有 5 级，其每一级要比后者 10 级中的每一级处理更多的工作。如果除此以外的其它细节都完全相同的话，那么你一定希望采用第一种情况的“5 级”管线，原因很简单：数据填充 5 级要比填充 10 级容易的多。而且如果处理器的管线不是始终充满数据的话，那么将会损失宝贵的执行效率这将意味着 CPU的执行效率

7、会在某种程度上大打折扣。那么 CPU 管线的长短有什么不同呢？其关键在于管线长度并不是简单的重复，可以说它把原来的每一级的工作细化，从而让每一级的工作更加简单，因此在“10 级”模式下完成每一级工作的时间要明显的快于“5 级”模式。最慢的（也是最复杂）的“级”结构决定了整个管线中的每个“级”的速度请牢牢记住这一点！我们假设上述第一种管线模式每一级需要 1 个时钟周期来执行，最慢可以在 1ns 内完成的话，那么基于这种管线结构的处理器的主频可以达到 1GHz（1/1ns = 1GHz）。现在的情况是 CPU 内的管线级数越来越多，为此必须明显的缩短时钟周期来提供等于或者高于较短管线处理器的性

8、能。好在，较长管线中每个时钟周期内所做的工作减少了，因此即使处理器频率提升了，但每个时钟周期缩短了，每个“级”所用的时间也就相应的减少了，从而可以让 CPU 运行在更高的频率上了。如果采用上述的第二种管线模式，可以把处理器主频提升到 2GHz，那么我们应该可以得到相当于原来的处理器 2 倍的性能如果管线一直保持满载的话。但事实并非如此，任何 CPU 内部的管线在预读取的时候总会有出错的情况存在，一旦出错了就必须把这条指令从第一级管线开始重新执行，稍微计算一下就可以得出结论：如果一块拥有 5 级管线的 CPU 在执行一条指令的时候，当执行到第 4 级时出错，那么从第一级管线开始重新执行这条指令

9、的速度，要比一块拥有 10 级管线的 CPU 在第 8 级管线出错时重新执行要快的多，也就是说我们根本无法充分的利用 CPU 的全部资源，那么我们为什么还需要更高主频的CPU 呢？回溯到几年以前，让我们看看当时 1.4GHz 和 1.5GHz 的奔腾四处理器刚刚问世之初的情况：当时 Intel公司将原奔腾三处理器的 10 级管线增加到了奔腾四的 20 级，管线长度一下提升了 100。最初上市的1.5GHz 奔腾四处理器曾经举步维艰，超长的管线带来的负面影响是由于预读取指令的出错从而造成的执行效率严重低下，甚至根本无法同 1GHz 主频的奔腾三处理器相对垒，但明显的优势就是大幅度的提升了主频，

10、因为 20 级管线同 10 级管线相比，每级管线的执行时间缩短了，虽然执行效率降低了，但处理器的主频是根据每级管线的执行时间而定的，跟执行效率没有关系，这也就是为什么采用 0.18 微米制程的Willamette 核心的奔腾四处理器能把主频轻松做到 2G 的奥秘！固然，更精湛的制造工艺也能对提升处理器的主频起到作用，当奔腾四换用 0.13 微米制造工艺的 Northwood 核心后，主频的优势才大幅度体现出来，一直冲到了 3.4G，长管线的 CPU 只有在高主频的情况下才能充分发挥优势用很高的频率、很短的时钟周期来弥补它在预读取指令出错时重新执行指令所浪费的时间。但是，拥有 20 级管线、

11、采用0.13 微米制程的 Northwood 核心的奔腾四处理器的理论频率极限是 3.5G，那怎么办呢？Intel 总是会采用“加长管线”这种屡试不爽的主频提升办法新出来的采用 Prescott 核心的奔腾四处理器（俗称 P4-E），居然采用了 31 级管线，通过上述介绍，很明显我们能得出 Prescott 核心的奔四处理器在一个时钟周期的处理效率上会比采用 Northwood 核心的奔四处理器慢上一大截，也就是说起初的 P4-E 并不比 P4-C 的快，虽然 P4-E 拥有了更大的二级缓存，但在同频率下，P4-E 绝对不是 P4-C 的对手，只有当 P4-E 的主频提升到了 5G 以上，才有

12、可能跟 P4-3.4C 的 CPU 对垒，著名的 CPU 效能测试软件 SuperPi 就能反应出这一差距来：P4-3.4E 的处理器，运算 Pi 值小数点后 100 万位需要 47 秒，这仅相当于 P4-2.4C 的成绩，而 P4-3.4C 运算只需要 31 秒，把同频率下的 P4-3.4E 远远的甩在了后面！ AMD 2500+处理器，采用了 10 级管线，只有 1.8G 的主频却能匹敌 2.4G 的 P4；苹果电脑的 G4 处理器，更是采用了 7 级管线，只有 1.2G 的主频却能匹敌 2.8C 的 P4，这些都要归功于更短的管线所带来的更高的执行效率，跟它们相比，执行效率方面 Inte

13、l 输在了管线长度上，但主频提升方面 Intel 又赢在了管线长度上，因为相对于“管线”这个较专业的问题，大多数消费者还是陌生的，人们只知道“处理器的主频越高速度就越快”这个片面的、错误的、荒谬的理论！这就是 Intel 的精明之处！ CPU 的处理性能不应该去看主频，而 INTEL 正是基于相当相当一部分人对 CPU 的不了解，采用了加长管线的做法来提高频率，从而误导了相当一部分的人盲目购买。CPU 的处理能力简单地说可以看成：实际处理能力=主频*执行效率，就拿 P4E 来说他的主频快是建立在使用了更长的管线基础之上的，而主频只与每级管线的执行速度有关与执行效率无关，加长管线的好处在与每级管

14、线的执行速度较快，但是管线越长（级数越多）执行效率越低下，AMD 的 PR值可能会搞得大家一头雾水，但是却客观划分了与其对手想对应的处理器的能力。为什么实际频率只有1.8G 的 AMD 2500+处理器运行速度比实际频率 2.4G 的 P4-2.4B 还快？为什么采用 0.13 微米制程的Tulatin 核心的处理器最高只能做到 1.4G，反而采用 0.18 微米制程的 Willamette 核心的处理器却能轻松做到 2G？下面我们就来分析一下到底是什么原因导致以上两种“怪圈”的存在。每块 CPU 中都有“执行管道流水线”的存在（以下简称“管线”），管线对于 CPU 的关系就类似汽车组装线与

15、汽车之间的关系。CPU 的管线并不是物理意义上供数据输入输出的的管路或通道，它是为了执行指令而归纳出的“下一步需要做的事情”。每一个指令的执行都必须经过相同的步骤，我们把这样的步骤称作“级”。管线中的“级”的任务包括分支下一步要执行的指令、分支数据的运算结果、分支结果的存储位置、执行运算等等最基础的 CPU 管线可以被分为 5 级： 1、取指令 2、译解指令 3、演算出操作数 4、执行指令 5、存储到高速缓存你可能会发现以上所说的 5 级的每一级的描述都非常的概括，同时如果增加一些特殊的级的话，管线将会有所延长： 1、取指令 1 2、取指令 2 3、译解指令 1 4、译解指令 2 5、演算

16、出操作数 6、分派操作 7、确定时 8、执行指令 9、存储到高速缓存 1 10、存储到高速缓存 2 无论是最基本的管线还是延长后的管线都是必须完成同样的任务：接受指令，输出运算结果。两者之间的不同是：前者只有 5 级，其每一级要比后者 10 级中的每一级处理更多的工作。如果除此以外的其它细节都完全相同的话，那么你一定希望采用第一种情况的“5 级”管线，原因很简单：数据填充 5 级要比填充 10 级容易的多。而且如果处理器的管线不是始终充满数据的话，那么将会损失宝贵的执行效率这将意味着 CPU的执行效率会在某种程度上大打折扣。那么 CPU 管线的长短有什么不同呢？其关键在于管线长度并不是简单的重复，可以说它把原来的每一级的工作细化，从而让每一级的工作更加简单，因此在“10 级”模式下完成每一级工作的时间要明显的快于“5 级”模式。最慢的（也是最复杂）的“级”结构决定了整个管线中的每个“级”的速度请牢牢记住这一点！我们假设上述第一种管线模式每一级需要 1 个时钟周期来执行，最慢可以在 1ns 内完成的话，那么

展开阅读全文