计算机高性能体系结构复习资料整理

资源描述

《计算机高性能体系结构复习资料整理》由会员分享，可在线阅读，更多相关《计算机高性能体系结构复习资料整理（9页珍藏版）》请在金锄头文库上搜索。

1、本资料是鹤鹤精心整理，仅限内部使用！！！本资料是鹤鹤精心整理，仅限内部使用！！！计算机计算机高性能高性能体系结构体系结构复习资料复习资料名词解释名词解释第一章高性能计算与高性能计算机第一章高性能计算与高性能计算机 MPP：大规模并行处理计算机：Massive Parallel Processor。由大量通用微处理器构成的多处理机系统，适合多指令流多数据流处理。 SMP：（Symmetric Multi-Processing）对称多处理结构的简称，是指在一个计算机上汇集了一组处理器(多 CPU),各 CPU 之间共享内存子系统以及总线结构。在这种技术的支持下，一个服务器系统

2、可以同时运行多个处理器，并共享内存和其他的主机资源。 DSM：分布共享存储，内存模块物理上局部于各个处理器内部，但逻辑上（用户）是共享存储的；这种结构也称为基于 Cache 目录的非一致内存访问（CC-NUMA）结构；高高性能计算机：性能计算机：（也称作巨型计算机、超级计算机）由多个计算单元组成，运算速度快、存储容量大、可靠性高的计算机系统。并行计算机：并行计算机：由多个处理单元组成的计算机系统，这些处理单元相互通讯和协助，能够告诉、高效地求解大型复杂问题。共享存储器多处理机：共享存储器多处理机：第二章第二章高性能计算机高性能计算机性能性能测评测评并行度：并行

3、度：指令并行执行的最大条数。在指令流水中，同时执行多条指令称为指令并行。并行性：并行性：计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。只要在时间上相互重叠，就存在并行性。它包括同时性与并发性两种含义。加速比：加速比：（speedup），是同一个任务在单处理器系统和并行处理器系统中运行消耗的时间的比率，用来衡量并行系统或程序并行化的性能和效果。绝对加速比：绝对加速比：将最好的串行算法与并行算法相比较. 定义一（与具体机器有关）将最好的串行算法在一台处理机上的运行时间与并行算法在 N 台处理机上运行的时间相比。定义二（与具体机器无关）将最好的串行算法在最快的顺序机

4、上的执行时间与并行算法在并行机上的运行时间相比。相对加速比：相对加速比：同一并行算法在单节点上运行时间与在多个相同节点构成的处理机系统上的运行时间之比。这种定义侧重于描述算法和并行计算机本身的可扩展性。并行机的可扩展性：并行机的可扩展性：对任意数量级的处理机和任意规模的问题，若所有算法的系统效率都为 1，则系统是可扩展的。第三章第三章高级流水线与指令并行高级流水线与指令并行基本基本（程序）（程序）块：块：如果一串连续的代码除了入口和出口以外，没有其他分支指令和转入点，则称之为一个基本程序块。指令相关：指令相关：是指指令之间存在的相互依赖的关系，属于程序固有的属性。指令

5、级并行：指令级并行：简称 ILP。是指指令之间存在的一种并行性，利用它，计算机可以并行执行两条或两条以上的指令。指令调度指令调度:为了充分发挥流水线的作用，必须设法让它满负荷的工作，这就要求充分开发指令之间存在的并行性，找出不相关的指令序列，让它们在流水线上重叠并行执行，这一工作就是指令调度。指令的指令的静态调度：静态调度：是指依靠编译器对代码进行静态调度，以减少相关和冲突。它不是在程序执行的过程中、而是在编译期间进行代码调度和优化的。指令的指令的动态调度：动态调度：是指在保持数据流和异常行为的情况下，通过硬件对指令执行顺序进行重新安排，以提高流水线的利用率且减少停顿现象。是

6、由硬件在程序实际运行时实施的。乱序执行技术：乱序执行技术：乱序执行（out-of-order execution）是指 CPU 采用了允许将多条指令不按程序规定的顺序分开发送给各相应电路单元处理的技术。推测执行：推测执行：允许在处理器还未判断指令是否执行之前就提前执行。分支预测：分支预测：（Branch Prediction)：从 P5 时代开始的一种先进的，解决处理分支指令（if-then-else)导致流水线失败的数据处理方法，由 CPU 来判断程序分支的进行方向，能够加快运算速度。保留站：保留站：在采用 Tomasulo 算法的 MIPS 处理器浮点部件中，在运算部件的

7、入口设置的用来保存一条已经流出并等待到本功能部件执行的指令（相关信息）。记分牌：记分牌：是一集中控制部件，其功能是控制数据寄存器与处理部件之间的数据传送。在记分牌中保存有与各个处理部件相联系的寄存器中的数据装载情况。当一个处理部件所要求的数据都已就绪（装载完毕），记分牌允许处理部件开始执行。当执行完成后，处理部件通知记分牌释放相关资源。所以在记分牌中记录了数据寄存器和多个处理部件状态的变化情况，通过它来检测和消除或减少数据相关性，加快程序执行速度。流水线：流水线：是多条指令同时执行的一种实现技术，是一种在连续指令流中开发指令级并行性的技术。流水线技术：流水线技术

8、：将一个重复的时序过程，分解成为若干个子过程，而每一个子过程都可有效地在其专用功能段上与其它子过程同时执行。数据竞争：数据竞争：当指令在流水线中重叠执行时，因需要用到前面指令的执行结果而发生的冲突。控制竞争控制竞争: 流水线遇到分支指令或其它会改变 PC 值的指令所引起的冲突。结构竞争：结构竞争：因硬件资源满足不了指令重叠执行的要求而发生的冲突。反相关：反相关：（Anti-dependence）(硬件出现冒险的 WAR) 指令 j 写入一个指令 I 将读取的寄存器或存储器位置，并且指令 I 首先执行名相关：名相关：（name dependence）两条指令使用相同名字(寄存

9、器或存储器位置)，但是却不交换数据输出相关：输出相关：（Output dependence）(硬件出现冒险的 WAW) 指令 i 和指令 j 写入相同的寄存器或存储器位置；必须保证指令的执行顺序控制相关：控制相关：是指由分支指令引起的相关。它需要根据分支指令的执行结果来确定后面该执行哪个分支上的指令。真数据相关：真数据相关：数据相关（真相关）。如果满足以下两个条件，则称指令 j 与指令 i 是数据相关的： A. 指令 i 产生的结果被指令 j 使用； B. 指令 j 与指令 k 数据相关，而指令 k 与指令 i 数据相关。数据相关：数据相关：考虑两条指令 i 和 j，i 在

10、j 的前面，如果下述条件之一成立，则称指令 j 与指令 i 数据相关：（1）指令 j 使用指令 i 产生的结果；（2）指令 j 与指令 k 数据相关，而指令 k 又与指令 i 数据相关精确异常：精确异常：（所谓不精确异常，是指：当执行指令 i 导致发生异常时，处理机的现场（状态）与严格按照程序顺序执行时指令 i 的现场不同。反之，如果发生异常时，处理机的现场跟严格按程序顺序执行时指令 i 的现场相同，则称为精确异常。） VLIW：超长指令字(Very long instruction word)指的是一种被设计为可以利用指令级并行(ILP)优势的 CPU 体系结构。一个

11、按照顺序执行指令的非超标量处理器不能充分的利用处理器的资源，有可能导致低性能。超标量：超标量：一种多指令流出技术。它在每个时钟周期流出的指令条数不固定，依代码的具体情况而定，但有个上限。超超流水：流水：在一个时钟周期内分时流出多条指令。超长指令字：超长指令字：一种多指令流出技术。VLIW 处理机在每个时钟周期流出的指令条数是固定的，这些指令构成一条长指令或者一个指令包，在这个指令包中，指令之间的并行性是通过指令显式地表示出来的。全局指令调度：全局指令调度：需要在多个基本块间移动指令的调度被称为全局指令调度。路径路径（踪迹）（踪迹）调度：调度：(trace scheduling

12、)，踪迹是程序执行的指令序列，通常有一个或多个基本块组成，踪迹内可以有分支，但不一定包含循环。踪迹调度会优化执行频率高的踪迹，减少其执行开销，踪迹调度包括踪迹选择和踪迹压缩两个步骤。关键路径：关键路径：是指根据指令间相关关系构成的数据流图中延迟最长的一条路径。循环展开：循环展开：是一种增加指令间并行性最简单和最常用的方法。它将循环展开若干遍后，通过重命名和指令调度来开发更多的并行性。循环级并行：循环级并行：循环的不同叠代之间存在的并行性。谓词执行：谓词执行：( predicated execution) 是显式并行技术( EPIC ) 的一个重要的组成部分, 是条件执行技术的

13、一种实现, 它为每条指令增加一个源操作数( 即谓词) 作为指令执行条件, 当谓词为真时执行指令中的操作, 否则将其转换为空操作处理。软件流水：软件流水：软件流水是一种重组循环体的技术，在软件流水循环（Software pipeline loop）的每一次迭代（即新的重组后的循环）体是由原循环的不同迭代中选出的指令组成的，可以达到消除相关性的目的。软件流水技术是通过对循环重新进行建构，使得每次迭代执行的指令是属于原循环不同迭代过程的，是用来安排循环指令，是这个循环的多次迭代并行执行的一种技术。结构冒险结构冒险（冲突（冲突 Hazard）：在流水线处理机中，如果某种指令组合因为资源

14、冲突不能正常执行则称该处理机有结构冲突，这种情况发生在功能部件不是完全流水或者资源份数不够时。第四章第四章互连与通信互连与通信互连互连网络：网络：由开关元件按一定拓扑结构和控制方式构成的网络以实现计算机系统内部多个处理机或多个功能部件间的相互连接。网络直径：网络直径：是指互联网络中任意两个结点之间距离的最大值。虚拟通道：虚拟通道：是两个节点间的逻辑链接，它是由源结点的片缓冲区、结点间的物理通道以及接收结点的片缓冲区组成。第五章第五章 Cache Coherence 简述题简述题第一章高性能计算与高性能计算机第一章高性能计算与高性能计算机何为高性能计算，研究高性能计算有

15、何意义？何为高性能计算，研究高性能计算有何意义？高性能计算(英文 high performance computing，缩写 HPC) 指通常使用很多处理器（作为单个机器的一部分）或者某一集群中组织的几台计算机（作为单个计算资源操作）的计算系统和环境。意义：1）高性能计算的内在含义 2）高性能计算的应用需求 3）高性能计算的战略地位何为并行计算机？简述当代几种主流的并行计算机系统何为并行计算机？简述当代几种主流的并行计算机系统并行计算机是由多个处理单元组成的计算机系统，这些处理单元相互通讯和协助，能够高速、高效地求解大型复杂问题。流行的并行计算机系统：对称多处理机系统(SM

16、P)、分布式共享存储系统(DSM)、大规模并行计算机系统(MPP)、集群系统(Cluster)、并行向量机（PVP）工作站机群（COW）等。何为何为 CMP？请简单说明？请简单说明 CMP 与与 SMP 的关系的关系 CMP：单芯片多处理器（Chip multiprocessors，简称 CMP），也指多核心。是由美国斯坦福大学提出的，其思想是将大规模并行处理器中的 SMP （对称多处理器）集成到同一芯片内，各个处理器并行执行不同的进程。CMP 相当于集成的 SMP。简述简述 MPP 和集群系统之间的主要区别和集群系统之间的主要区别（异同点）（异同点） MPP 系统多于 100 个 PE，消息传递、分布存储，峰值可达到 3Tperformance，可扩展，价格昂贵，市场有限，可解决高难度问题，是国家综合实力的象征； Culster：包括 NOW 和 COW 两种；其特点是：投资风险小，软件财富继承性好，可构成异构系统，资源利用率高，通信开销大等特点 MPP(巨型并行处理)：这

展开阅读全文

计算机高性能体系结构复习资料整理

最新文档