体系结构复习重点【升级版删减版】

资源描述

《体系结构复习重点【升级版删减版】》由会员分享，可在线阅读，更多相关《体系结构复习重点【升级版删减版】（19页珍藏版）》请在金锄头文库上搜索。

1、体系机构复习重点注：红色代表不确定，玫粉色是加进去的第一章不考大题，第二章不考概念一、小题1 Amdahl 定律系统中某一部件由于采用更快的执行方式后，整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。2 指令级并行一种平行计算形式，在一个程式运行中，许多指令操作，能在同时间进行3 程序的局部性原理：是指程序在执行时呈现出局部性规律，即在一段时间内，整个程序的执行仅限于程序中的某一部分。相应地，执行所访问的存储空间也局限于某个内存区域。4 透明性概念定义：本来存在的事物或属性，从某种角度看似乎不存在5 大概率事件优先原则对于大概率事件（最常见的事件），赋予它优先的处理权和资

2、源使用权，以获得全局的最优结果。7 超标量处理机采取设置 M 条指令流水线同时并行，来实现并行度为 m 的处理机8 向量流水处理把要解决的问题转化成向量运算，采用横向，纵向，纵横处理方式对向量各分量进行独立并行的处理。9 系列机具有相同的系统结构，但组成和实现技术不同的一系列计算机系统兼容（软件，硬件）; 兼容最基本特征; 向右兼容 11 并行性指令内部指令级线程级任务级作业级指计算机系统具有可以同时进行运算或操作的特性，在同一时间完成两种或两种以上工作。它包括同时性与并发性两种含义。同时性指两个或两个以上事件在同一时刻发生。并发性指两个或两个以上事件在同一时间间隔发生。14 写直达

3、法写回写直达法：在执行写操作时，不仅把信息写入 Cache 中相应的块，而且也写入下一级存储器中相应的块。15 加速比加速比（speedup），是同一个任务在单处理器系统和并行处理器系统中运行消耗的时间的比率，用来衡量并行系统或程序并行化的性能和效果。16 数据相关在执行本条指令的过中，如果用到的指令、操作数、变址偏移量等正好是前面指令的执行结果，则必须等待前面的指令执行完成，并把结果写到主存或通用寄存器中之后，本条指令才能开始执行，这种相关称为数据相关。17 控制相关条件分支指令、转子程序指令、中断等引起的相关。18 存储器系统计算机中的存储系统是用来保存数据和程序的。对存储器最基本的要

4、求就是存储容量要大、存取速度快、成本价格低。为了满足这一要求，提出了多级存储体系结构。一般可分为高速缓冲存储器、主存、外存 3 个层次，有时候还包括 CPU 内部的寄存器以及控制存储器。20 虚拟机指通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。二、简单问答题1 计算机体系结构：计算机系统结构就是计算机的机器语言程序员或编译程序编写者所看到的外特性，是硬件子系统的概念结构及其功能特性。2 CPI每条指令所需的平均时钟周期数3 软件兼容一个软件可以不经修改或者只需要少量修改就可以由一台计算机移植到另一台计算机上运行，差别只是执行的时间不同。4 仿真与模拟仿真是指

5、用微程序的方法在一台计算机上实现另一台计算机的指令系统。模拟是指用软件的方法在一台计算机上，实现另一台计算机的指令系统，5 时间重叠，资源重叠时间重叠：在并行性概念中引入时间因素，让多个处理过程在时间上相互错开，轮流重叠的使用同一套硬件设备的各个部分，以加快硬件周转而赢得速度。，以数量取胜，通过重复设置硬件资源，大幅度的提高计算机系统的资源重叠（重复）：在并行性概念中引入空间因素性能。6 先行控制器先行控制器处理机结构：包括三个独立的控制器和四个缓冲栈。其中三个控制器为：存储控制器、指令控制器、运算控制器。四个缓冲栈：先行指令缓冲栈、线性读数缓冲栈、现行操作栈，后行写数栈7 紧密耦合系统，松散

6、耦合系统(smp,mpp)紧密耦合系统：机间物理连接的频带较高，它们往往通过总线或者告诉开关实现互联，可以共享主存。松散耦合系统：通过通道或者通信线路实现计算机间互联，共享某些外围设备，机器间的相互作用是在文件或者数据集一级进行。8 异构型多处理机系统，同构型多处理机类型同构型（对称型）多处理机：由多个同类型，至少担负同等功能的处理机组成，同时处理同一作业中能并行执行的多个任务。异构型（非对称型）多处理机：由多个不同类型，至少担负不同功能的处理机组成，按照作业要求的顺序，利用时间重叠原理，依次对它们的多个任务进行加工，各自完成规定的功能动作。9 佛林分类他按照指令流和数据流的多倍性特征对计算机

7、系统进行分类，把计算机系统分4 大类：单指令流单数据流、单指令流多数据流、多指令流单数据流、多指令流多数据流 10 并行等级划分(1) 指令内部并行：指令内部的微操作之间的并行。 (2) 指令级并行(Instruction Level Parallel，ILP)：并行执行两条或多条指令。 (3) 任务级或过程级并行：并行执行两个或多个过程或任务(程序段)。 (4) 作业或程序级并行：在多个作业或程序间的并行11 堆栈型机器通用计算型一种计算模型。这种类型的电脑，内存以堆栈（Stack）储存。它的指令集中包含了零位址指令（0-operand instruction set）。硬件在执行

8、运算时，到堆栈的顶端去取出算子，至运算结束时，再储存到堆栈的顶端。12 RISC 指令系统的设计原则a 大多数指令在单周期内完成 b 采用 LOAD/STORE 结构 c 硬布线控制逻辑d 减少指令和寻址方式的方案f 固定的指令格式g 注重译码的优化13 静态流水、动态流水动态流水线在同一时间内允许按多种不同运算的联结方式工作。静态流水线在同一时间内只能按一种运算的联结方式工作。14 分支指令调度分支条件由指令确定，提供一组比较指令，用于比较两个寄存器的值。有的分支指令可以直接判断寄存器内容是否为负，或者比较两个寄存器是否相等。分支的目标地址由 16 位带符号偏移量左移两位后和 PC 相加的结

9、果来决定一条浮点条件分支指令：通过测试浮点状态寄存器来决定是否进行分支。15 链接技术，分段开采当利用向量指令间存在的先写后读的数据相关性来加快向量指令序列执行速度的技术称为链接技术；向量的长度大于向量寄存器的长度时，必须把长向量分成长度固定的段，采用循环结构处理这个长向量，这种技术称为向量循环开采技术，也称为向量分段开采技术。16 半性能向量长度达到一半最大性能值所需的向量长度。17 超流水通过细化流水,提高主频,使得机器在一个周期内完成一个甚至多个操作,其实质是用时间换取空间。18 CISC复杂指令集 CPU 内部为将较复杂的指令译码，也就是指令较长，分成几个微指令去执行，正是如此开发程序

10、比较容易（指令多的缘故），但是由于指令复杂，执行工作效率较差，处理数据速度较慢，PC 中 Pentium 的结构都为 CISC CPU。三、计算题1、Amdahl 定律（见书 P10 两个例子）系统中某一部件由于采用更快的执行方式后，整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。改进后整个系统的加速比达到：题假定我们利用增加向量处理模块来提高计算机的运算速度。计算机处理向量的速度比其通常的运算要快 20 倍。我们将可用向量处理部分所花费的时间占总时间的百分比称为可向量化百分比。1)求出加速比 S 和可向量化百分比 F 之间的关系式。2)当要得到加速比为 2 时的可向量化

11、百分比 F 为多少？解1)2) 由上式,将 S=2 代入得:F = 10/19 = 0.53 2、CPI 和等效 CPI（P11）平均时钟周期数 CPI：平均每条指令执行所需的时钟周期。越少，程序执行越快。这主要取决于 CPU 的体系结构，包括指令系统的设计、指令时序过程的安排等。CPI 的含义：以 CPU 为评估的模块，以指令系统中各条指令被执行的概率（频度）为依据，以平均每条指令所花费的时钟周期数标尺，对 CPU 的速度进行评估。CPU 时间=CPU 时钟周期数/频率；CPU 时间=CPU 时钟周期数*时钟周期长；CPU 时间= （IC*CPI ）/频率 f；平均时钟周期数 CPI=C

12、PU 时钟周期数/IC（指令的条数）；)(CPU1iniiICP的时钟周期数通常用 MIPS 和 MFLOPS 反映系统（CPU ）吞吐率：MIPS（Million Instructions Per Second）MIPS = =610*执行时间指令条数 610*CPIfMFLOPS（Million Floating point Operations Per Second）时间改进后改进部分的执行时间改进前改进部分的执行改进部分的加速比：时间改进前整个任务的执行可改进部分的执行

13、时间可改进部分的比例： SeFSTSne01()190/)1()()(11 III iniini iiMFLOPS = 610*执行时间程序中的浮点操作次数题有效（平均）CPI 计算假设在一台 40MHZ 处理机上运行 200,000 条指令的目标代码，程序主要由四种指令组成。根据程序跟踪实验结果，已知指令混合比和每种指令所需的指令数如下。计算在单处理机上用跟踪数据运行程序的平均 CPI,并根据所得的 CPI,计算相应的 MIPS 速率。指令类型 CPI 指令混合比算术和逻辑 1 60%高速缓存命中的加载/存储 2 18%转移 4 12%高速存储缺

14、失的存储器访问 8 10%解 CPI = 1*60% + 2*18% + 4*12% + 8*10% = 2.24MIPS = f/(CPI*106) = (40*106)/(2.24*106) = 17.86题A 机执行的程序中有 20%转移指令(2TC)，转移指令都需要一条比较指令(1TC)配合，其他指令 1TC。B 机中转移指令包含比较指令，但 TC 比 A 机慢15%。 A 机、B 机哪个工作速度快？A 机：TCPUA=INA(0.2 2+0.2 1+0.6 1)TCA=1.2 INA TCAB 机： TCPUB=0.8INA(0.2/0.8) 2+(1- 0.2/0.8) 1) 1.

15、15TCA=1.15 INA TCA结果：B 机比 A 机工作速度快。注意：不能仅按主频衡量系统性能。等效指令速度：吉普森（Gibson）法：加减法 50，乘法 15，除法 5，程序控制 15，其他 15静态指令使用频度：在程序中直接统计动态指令使用频度：在程序执行过程中统计题假设在一般程序中浮点开平方操作 FPSQR 所占的比例为 2，它的 CPI为 100；其他浮点操作 FP 所占的比例为 23，它的 CPI4.0；其余 75指令的 CPI1.33 ，计算该处理机的等效 CPI。如果 FPSQR 操作的 CPI 也为 4.0，重新计算等效 CPI。等效 CPI11002 423 1.3375 3.92等效 CPI2425 1.3375 2.00改进了在用户程序中仅占 2的开平方操作，整个机器的等效运算速度提高了近一倍。ni ii1)Weght(Tm等效指令执行时间 nii1MIPSetI等效指令速度）（等效 ni i1CPI题我国早期研制的一种小型计算机 DJS-130 定点 16 位，加法指令每秒 50 万次，但没有硬件乘除法指令。用软件实现乘除法，速度低 100 倍左右。求等效指令速度。解：等效指令速度为：即每秒 2 万次，由于用软件实现乘除法，等效指令速度降低了 25 倍。3、Huffman 编码（见 P92

展开阅读全文

体系结构复习重点【升级版删减版】

最新文档