体系结构复习重点【升级版删减版】

上传人:子 文档编号:43263915 上传时间:2018-06-05 格式:DOC 页数:19 大小:1.89MB
返回 下载 相关 举报
体系结构复习重点【升级版删减版】_第1页
第1页 / 共19页
体系结构复习重点【升级版删减版】_第2页
第2页 / 共19页
体系结构复习重点【升级版删减版】_第3页
第3页 / 共19页
体系结构复习重点【升级版删减版】_第4页
第4页 / 共19页
体系结构复习重点【升级版删减版】_第5页
第5页 / 共19页
点击查看更多>>
资源描述

《体系结构复习重点【升级版删减版】》由会员分享,可在线阅读,更多相关《体系结构复习重点【升级版删减版】(19页珍藏版)》请在金锄头文库上搜索。

1、体系机构复习重点体系机构复习重点注:注:红色红色代表不确定,代表不确定,玫粉色玫粉色是加进去的是加进去的第一章不考大题,第二章不考概念第一章不考大题,第二章不考概念一、小题一、小题1 Amdahl 定律 系统中某一部件由于采用更快的执行方式后,整个系统性能的提高与这种执行 方式的使用频率或占总执行时间的比例有关。2 指令级并行 一种平行计算形式,在一个程式运行中,许多指令操作,能在同时间进行3 程序的局部性原理: 是指程序在执行时呈现出局部性规律,即在一段时间内,整个程序的执行仅限 于程序中的某一部分。相应地,执行所访问的存储空间也局限于某个内存区域。4 透明性概念 定义:本来存在的事物或属性

2、,从某种角度看似乎不存在5 大概率事件优先原则 对于大概率事件(最常见的事件) ,赋予它优先的处理权和资源使用权,以 获得全局的最优结果。7 超标量处理机 采取设置 M 条指令流水线同时并行,来实现并行度为 m 的处理机8 向量流水处理 把要解决的问题转化成向量运算, 采用横向,纵向,纵横处理方式 对向量各分量进行独立并行的处理。9 系列机 具有相同的系统结构,但组成和实现技术不同的一系列计算机系统 兼容(软件,硬件); 兼容最基本特征; 向右兼容 11 并行性 指令内部 指令级 线程级 任务级 作业级指计算机系统具有可以同时进行运算或操作的特性,在同一时间完成两种或 两种以上工作。它包括同时

3、性与并发性两种含义。同时性指两个或两个以上事件在同一时刻发生。并发性指两个或两个以上事件在同一时间间隔发生。14 写直达法 写回写直达法:在执行写操作时,不仅把信息写入 Cache 中相应的块,而且也写 入下一级存储器中相应的块。15 加速比加速比(speedup) ,是同一个任务在单处理器系统和并行处理器系统中运行 消耗的时间的比率,用来衡量并行系统或程序并行化的性能和效果。16 数据相关在执行本条指令的过中,如果用到的指令、操作数、变址偏移量等正好是前 面指令的执行结果,则必须等待前面的指令执行完成,并把结果写到主存或通 用寄存器中之后,本条指令才能开始执行,这种相关称为数据相关。17 控

4、制相关条件分支指令、转子程序指令、中断等引起的相关。18 存储器系统计算机中的存储系统是用来保存数据和程序的。对存储器最基本的要求就是 存储容量要大、存取速度快、成本价格低。为了满足这一要求,提出了多级存 储体系结构。一般可分为高速缓冲存储器、主存、外存 3 个层次,有时候还包 括 CPU 内部的寄存器以及控制存储器。20 虚拟机 指通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完 整计算机系统。二、简单问答题二、简单问答题1 计算机体系结构: 计算机系统结构就是计算机的机器语言程序员或编译程序编写者所看到的外特 性,是硬件子系统的概念结构及其功能特性。2 CPI 每条指令所

5、需的平均时钟周期数3 软件兼容 一个软件可以不经修改或者只需要少量修改就可以由一台计算机移植到另一台 计算机上运行,差别只是执行的时间不同。4 仿真与模拟仿真是指用微程序的方法在一台计算机上实现另一台计算机的指令系统。 模拟是指用软件的方法在一台计算机上,实现另一台计算机的指令系统,5 时间重叠,资源重叠 时间重叠:在并行性概念中引入时间因素,让多个处理过程在时间上相互错开, 轮流重叠的使用同一套硬件设备的各个部分,以加快硬件周转而赢得速度。 ,以数量取胜,通过重复设置硬件资源,大幅度的提高计算机系统的 资源重叠(重复):在并行性概念中引入空间因素性能。6 先行控制器 先行控制器处理机结构:包

6、括三个独立的控制器和四个缓冲栈。其中三个控制 器为:存储控制器、指令控制器、运算控制器。四个缓冲栈:先行指令缓冲栈、 线性读数缓冲栈、现行操作栈,后行写数栈7 紧密耦合系统,松散耦合系统(smp,mpp) 紧密耦合系统:机间物理连接的频带较高,它们往往通过总线或者告诉开关实 现互联,可以共享主存。 松散耦合系统:通过通道或者通信线路实现计算机间互联,共享某些外围设备, 机器间的相互作用是在文件或者数据集一级进行。8 异构型多处理机系统,同构型多处理机类型 同构型(对称型)多处理机:由多个同类型,至少担负同等功能的处理机组成, 同时处理同一作业中能并行执行的多个任务。 异构型(非对称型)多处理机

7、:由多个不同类型,至少担负不同功能的处理机 组成,按照作业要求的顺序,利用时间重叠原理,依次对它们的多个任务进行 加工,各自完成规定的功能动作。9 佛林分类 他按照他按照指令流指令流和数据流的多倍性特征对和数据流的多倍性特征对计算机系统计算机系统进行分类,把计算机系统分进行分类,把计算机系统分 4 大类:单大类:单指令流指令流单数据流、单数据流、单指令流多数据流单指令流多数据流 、多多指令流指令流单数据流、单数据流、多指令多指令 流多数据流流多数据流 10 并行等级划分(1) 指令内部并行:指令内部的微操作之间的并行。 (2) 指令级并行(Instruction Level Parallel,

8、ILP):并行执行两条或多条 指令。 (3) 任务级或过程级并行:并行执行两个或多个过程或任务(程序段)。 (4) 作业或程序级并行:在多个作业或程序间的并行11 堆栈型机器 通用计算型 一种计算模型。这种类型的电脑,内存以堆栈(Stack)储存。它的指令集中包 含了零位址指令(“0-operand“ instruction set) 。硬件在执行运算时,到堆 栈的顶端去取出算子,至运算结束时,再储存到堆栈的顶端。12 RISC 指令系统的设计原则 a 大多数指令在单周期内完成 b 采用 LOAD/STORE 结构 c 硬布线控制逻辑 d 减少指令和寻址方式的方案f 固定的指令格式g 注重译码

9、的优化13 静态流水、动态流水动态流水线在同一时间内允许按多种不同运算的联结方式工作。静态流水线 在同一时间内只能按一种运算的联结方式工作。14 分支指令调度 分支条件由指令确定,提供一组比较指令,用于比较两个寄存器的值。有的分 支指令可以直接判断寄存器内容是否为负,或者比较两个寄存器是否相等。分 支的目标地址由 16 位带符号偏移量左移两位后和 PC 相加的结果来决定一条浮 点条件分支指令:通过测试浮点状态寄存器来决定是否进行分支。15 链接技术,分段开采 当利用向量指令间存在的先写后读的数据相关性来加快向量指令序列执行速度 的技术称为链接技术;向量的长度大于向量寄存器的长度时,必须把长向量

10、分 成长度固定的段,采用循环结构处理这个长向量,这种技术称为向量循环开采 技术,也称为向量分段开采技术。16 半性能向量长度 达到一半最大性能值所需的向量长度。17 超流水 通过细化流水,提高主频,使得机器在一个周期内完成一个甚至多个操作,其实质 是用时间换取空间。18 CISC复杂指令集 CPU 内部为将较复杂的指令译码,也就是指令较长,分成几个微 指令去执行,正是如此开发程序比较容易(指令多的缘故) ,但是由于指令复杂, 执行工作效率较差,处理数据速度较慢,PC 中 Pentium 的结构都为 CISC CPU。三、计算题三、计算题1、Amdahl 定律(见书 P10 两个例子)系统中某一

11、部件由于采用更快的执行方式后,整个系统性能的提高与这种执行 方式的使用频率或占总执行时间的比例有关。改进后整个系统的加速比达到:题假定我们利用增加向量处理模块来提高计算机的运算速度。计算机处理向 量的速度比其通常的运算要快 20 倍。我们将可用向量处理部分所花费的时间占 总时间的百分比称为可向量化百分比。 1)求出加速比 S 和可向量化百分比 F 之间的关系式。 2)当要得到加速比为 2 时的可向量化百分比 F 为多少? 解1)2) 由上式,将 S=2 代入 得:F = 10/19 = 0.53 2、CPI 和等效 CPI(P11)平均时钟周期数 CPI:平均每条指令执行所需的时钟周期。 越少

12、,程序执行越快。这主要取决于 CPU 的体系结构,包括指 令系统的设计、指令时序过程的安排等。 CPI 的含义: 以 CPU 为评估的模块,以指令系统中各条指令被执行的概 率(频度)为依据,以平均每条指令所花费的时钟周期数标尺,对 CPU 的速度 进行评估。 CPU 时间=CPU 时钟周期数/频率; CPU 时间=CPU 时钟周期数*时钟周期长; CPU 时间=(IC*CPI)/频率 f; 平均时钟周期数 CPI=CPU 时钟周期数/IC(指令的条数) ;)(CPU1iniiICPI 的时钟周期数通常用 MIPS 和 MFLOPS 反映系统(CPU)吞吐率: MIPS(Million Inst

13、ructions Per Second)MIPS = =610*执行时间指令条数610*CPIfMFLOPS(Million Floating point Operations Per Second)时间改进后改进部分的执行时间改进前改进部分的执行改进部分的加速比:时间改进前整个任务的执行可改进部分的执行时间可改进部分的比例:SeFeST TFF Sn neee 011 ()FFFS192020 20/)1 (1)()(11 ICICPIICICPI CPIiniiniii MFLOPS = 610*执行时间程序中的浮点操作次数题有效(平均)CPI 计算 假设在一台 40MHZ 处理机上运行

14、200,000 条指令 的目标代码,程序主要由四种指令组成。根据程序跟踪实验结果,已知指令混 合比和每种指令所需的指令数如下。计算在单处理机上用跟踪数据运行程序的 平均 CPI,并根据所得的 CPI,计算相应的 MIPS 速率。指令类型 CPI 指令混合比 算术和逻辑 1 60% 高速缓存命中的加载/存储 2 18% 转移 4 12% 高速存储缺失的存储器访问 8 10% 解 CPI = 1*60% + 2*18% + 4*12% + 8*10% = 2.24MIPS = f/(CPI*106) = (40*106)/(2.24*106) = 17.86 题A 机执行的程序中有 20%转移指令

15、(2TC),转移指令都需要一条比较指令 (1TC)配合,其他指令 1TC。B 机中转移指令包含比较指令,但 TC 比 A 机慢 15%。A 机、B 机哪个工作速度快? A 机:TCPUA=INA(0.2 2+0.2 1+0.6 1)TCA=1.2 INA TCA B 机:TCPUB=0.8INA(0.2/0.8) 2+(1- 0.2/0.8) 1) 1.15TCA =1.15 INA TCA 结果:B 机比 A 机工作速度快。 注意:不能仅按主频衡量系统性能。等效指令速度等效指令速度:吉普森(Gibson)法:加减法 50,乘法 15,除法 5,程 序控制 15,其他 15静态指令使用频度:在

16、程序中直接统计动态指令使用频度:在程序执行过程中统计题假设在一般程序中浮点开平方操作 FPSQR 所占的比例为 2,它的 CPI 为 100;其他浮点操作 FP 所占的比例为 23,它的 CPI4.0;其余 75指令 的 CPI1.33,计算该处理机的等效 CPI。如果 FPSQR 操作的 CPI 也为 4.0,重 新计算等效 CPI。 等效 CPI110024231.33753.92 等效 CPI24251.33752.00 改进了在用户程序中仅占 2的开平方操作,整个机器的等效运算速度提高了 近一倍。 niii1)Weight(TimeT等效指令执行时间 nii1MIPSWeight1MIPS等

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号