计算机系统结构复习提要答案

上传人:re****.1 文档编号:563742130 上传时间:2022-09-22 格式:DOCX 页数:9 大小:180.46KB
返回 下载 相关 举报
计算机系统结构复习提要答案_第1页
第1页 / 共9页
计算机系统结构复习提要答案_第2页
第2页 / 共9页
计算机系统结构复习提要答案_第3页
第3页 / 共9页
计算机系统结构复习提要答案_第4页
第4页 / 共9页
计算机系统结构复习提要答案_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《计算机系统结构复习提要答案》由会员分享,可在线阅读,更多相关《计算机系统结构复习提要答案(9页珍藏版)》请在金锄头文库上搜索。

1、计算机系统结构复习提要答案一、名词解释Cache 2:1经验规则:人小为N的直接映彖Cache的失效率约等于人小为N/2的两路组相联Cache的实效率。计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。透明性:在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的 概念称为透明性。流水线:将一个重复的时序过程,分解成为若干个子过程,而每一个子过程都可有效地在其 专用功能段上与其它子过程同时执行。定向:用来解决写后读冲突的。在发生写后读相关的情况卞,在计算结果尚未出来之前,后 面等待使用该结果的指令并不见得是马上就要用该结果。如果能够将该计算结果从其产生

2、的 地方直接送到其它指令需要它的地方,那么就可以避免停顿。CISC:复杂指令集计算机RISC:精简指令集计算机多级存储层次:采用不同的技术实现的存储器,处在离CPU不同距离的层次上,各存储器 之间一般满足包容关系,即任何一层存储器中的内容都是其卞一层(离CPU更远的一层) 存储器中内容的子集。目标是达到离CPU最近的存储器的速度,最远的存储器的容量。并行性:计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。只要在时间上相 互重叠,就存在并行性。它包拾同时性与并发性两种含义。指令级并行:简称ILP。是指指令之间存在的一种并行性,利用它,计算机可以并行执行两 条或两条以上的指令。命中率:C

3、PU访问存储系统时,在Ml中找到所需信息的概率。CPI:每条指令的平均时钟周期数。Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高, 受限于该部件的执行时间占总执行时间的百分比。链接技术:具有先写后读相关的两条指令,在不出现功能部件冲突和V冲突的情况下,可 以把功能部件链接起来进行流水处理,以达到加快执行的目的。二、回答以下问题:1. 经典NHPS流水线分哪5个功能段?取指令周期(IF)指令译码器/读寄存器周期(ID)执行/有效地址计算周期(EX)存储 器访问/分子完成周期(MEM) 写回周期(WB)2. 流水线有哪3种相关?哪3种冲突?数据相关,名相关,控制

4、相关 结构冲突,数据冲突,控制冲突3. 提高并行性的技术途径有哪3种?动态分支预测技术,多指令流出技术,循坏展开和指令调度4. 对向量处理有哪3种方式?横向(水平)处理方式,纵向(垂直)处理方式,纵横(分组)处理方式5. Cache失效可以分为哪3种?强制性失效,容量失效,冲突失效6. 在存储层次中,常用的替换算法有哪3种?随机法,先进先出法,最近最少使用法7. 在进行指令集格式设计时,有哪3种设计方法?指令集格式的设计:有变长编码格式、固定长度编码格式和混合型编码格式3种。8. 消除瓶颈的两种方法是?细分瓶颈段与重复设置瓶颈段9. 在人多数指令集结构的功能设计中必须考虑支持的3种类型的指令是

5、? 变长编码格式,定长编码格式,混合型编码格式10. 根据指令读和写访问顺序,将数据冲突分哪3类? 写后读冲突,写后写冲突,读后写冲突三、请简述以下内容:1. 简述RISC指令集结构的设计原则和CISC指令集结构功能设计的主要目标,根据CPU性 能公式简述RISC指令集结构计算机和CISC指令集结构计算机的性能特点。简述RISC指令集结构的设计原则。答:(1)选取使用频率最高的指令,并补充一些最有用的指令;(2)每条指令的功能 应尽可能简单,并在一个机器周期内完成;(3)所有指令长度均相同:(4)只有Load和Store 操作指令才访问存储器,其它指令操作均在寄存器之间进行;(5)以简单有效的

6、方式支持 高级语言。简述CISC指令集结构功能设计的主要目标答:主要目标是增强指令功能,把越来越多的功能交由硬件来实现,并且指令的数量也 是越来越多。答:CPU性能公式:CPU时间=ICXCPIXT其中,IC为目标程序被执行的指令条数,CPI为指令平均执行周期数,T是时钟周期的 时间。相同功能的CISC目标程序的指令条数ICcisc少于RISC的ICrisc,但是CISC的CPIcisc 和Tcisc都人于RISC的CPIrisc和丁珀乂,因此,CISC目标程序的执行时间比RISC的更长。2. 计算机系统设计中经常使用的4个定量原理是什么?并说出它们的含义。答:(1)以经常性事件为重点。在计算

7、机系统的设计中,对经常发生的情况,赋予它优 先的处理权和资源使用权,以得到更多的总体上的改进。(2) Amdahl定律。加快某部件执 行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。(3) CPU性能公 式。执行一个程序所需的CPU时间=/C XCPI X时钟周期时间。(4)程序的局部性原理。 程序在执行时所访问地址的分布不是随机的,而是相对地簇聚。3. 指令的执行可采用顺序执行、重叠执行和流水线三种方式,它们的主要区别是什么?各有 何优缺点。答:(1)指令的顺序执行是指指令与指令之间顺序串行。即上一条指令全部执行完后, 才能开始执行下一条指令。优点:控制简单,节省设备。缺点:

8、执行指令的速度慢,功能部件的利用率低。(2)指令的重叠指令是在相邻的指令之间,让第k条指令与取第k+1条指令同时进行。 重叠执行不能加快单条指令的执行速度,但在硬件增加不多的情况下,可以加快相邻两条指 令以及整段程序的执行速度。与顺序方式相比,功能部件的利用率提高了,控制变复杂了。(3)指令的流水执行是把一个指令的执行过程分解为若干个子过程,每个子过程由专门的 功能部件来实现。把多个处理过程在时间上错开,依次通过各功能段,每个子过程与其它的 子过程并行进行。依靠提高吞吐率来提高系统性能。流水线中各段的时间应尽可能相等。4. 请简述冯.诺依曼结构计算机主要特点及相关的技术改进。特点:1)、以运算

9、器为中心。2)、在存储器中,指令和数据同等对待。3)、存储器是按地 址访问、按顺序线性编址的一维结构,每个存储单元的为数是固定的。4)、指令时顺序执 行的,即一般是按照指令在存储器中存储的顺序执行。5)、指令由操作码和地址码组成。6)、 指令和数据均以二进制编码表示,采用二进制运算。相关技术改进:1)、对输入/输出方式的改进2)、采用并行处理技术3)、存储器组织结构 的发展4)、指令集的发展。5 .简述“Cache主存”层次与“主存一辅存”层次的区别。 答:存储层次比较项目“Cache主存“层次“主存一辅存”层次目的为了弥补主存速度的不足为了弥补主存容虽的不足存储管理的实现全部由专用硬件实现主

10、要由软件实现访问速度的比值(第一级比第二级)几比一几万比一典型的块(页)大小儿卜个7节几百到几个字节CPU对第二级的访问方式可直接访问均通过第一级不命中时CPU是否切换不切换切换到其它进程6. 写出三级Cache的平均访问时间的公式。解:平均访存时间=命中时间+失效率X失效开销只有第I层失效时才会访问第1 + 1。设三级Cache的命中率分别为Hli、旳2、九3,失效率分别为肮1、12、“L3,第三 级Cache的失效开销为PL3O平均访问时间 Ta =Hli+M.i H12+M12(Hl3+(L3XPl3)7. 降低Cache失效率有哪几种方法?简述其基本思想。 答:常用的降低Cache失效

11、率的方法有下面几种:(1)增加Cache块大小。增加块人小利用了程序的空间局部性。(2)增加Cache的容量。(3)提高相联度,降低冲突失效。(4)伪相联Cache,降低冲突失效。当对伪相联Cache进行访问时,首先是按与直接 映象相同的方式进行访问。如果命中,则从相应的块中取出所访问的数据,送给CPU,访 问结束。如果不命中,就将索引字段的最高位取反,然后按照新索引去寻找“伪相联组”中的 对应块。如果这一块的标识匹配,则称发生了“伪命中”。否则,就访问下一级存储器。(5)硬件预取技术。在处理器提出访问请求前预取指令和数据。(6)由编译器控制的预取,硬件预取的替代方法,在编译时加入预取的指令,

12、在数据 被用到之前发出预取请求。(7)编译器优化,通过对软件的优化来降低失效率。(8)“価牲” Cache。在Cache和其下一级存储器的数据通路之间增设一个全相联的 小Cache,存放因冲突而被替换出去的那些块。每当发生不命中时,在访问下一级存储器之 前,先检查“牺牲Cache中是否含有所需的块。如呆有,就将该块与Cache中某个块做交 换,把所需的块从“牺牲” Cache调入Cache。8试从3C失效的关系分析增加块人小对Cache性能的影响。降低失效率最简单的方法是增加块人小。(1)对于给定的Cache容量,当块人小增加( 从16字节开始)时,失效率开始是下降,后来反而上升了。(2) C

13、ache容量越大,使失效率达到最低的块大小就越大。导致上述失效率先下降后上升的原因,在于增加块大小会产生双重作用。一方面它减少 了强制性失效,因为局部性原理有两方面的含义:时间局部性和空间局部性,增加块人小利 用了空间局部性:另一方面,由于增加块犬小会减少Cache中块的数目,所以有可能会增 加冲突失效。在Cache容量较小时,甚至还会增加容量失效。刚开始增加块人小时,由于 块人小还不是很大,上述的第一种作用超过第二种作用,从而使失效率下降。但等到块人小 较犬时,第二种作用超过第一种作用,使失效率上升。9.简述减小Cache失效开销的几种方法答:让读失效优先于写、写缓冲合并、请求字处理技术、非

14、阻塞Cache或非锁定Cache技术、 采用二级Cache0四、计算题请参考书中练习1.7将计算机系统中某一功能的处理速度加快10倍,但该功能的处理时间仅为整个系 统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少?解 由题可知:可改进比例=40% = 0.4 部件加速比=10根据Amdahl定律可知:系统加速比=5一 = 1.5625/.亠八 0.4采用此增强功能方法后,能使整个系统的性能提高到原来的1.5625倍。1.8计算机系统中有三个部件可以改进,这三个部件的部件加速比为: 部件加速比1=30; 部件加速比2=20: 部件加速比3=10(1)如果部件1和部件2的可改

15、进比例均为30%,那么当部件3的可改进比例为多 少时,系统加速比才可以达到10?(2)如果三个部件的可改进比例分别为30%、30%和20%,三个部件同时改进,那么 系统中不可加速部分的执行时间在总执行时间中占的比例是多少?解:(1)在多个部件可改进情况下,Amdahl定理的扩展:己知 Si=30, S2=20, S3=10, Sn=10, Fi=0.3, F2=0.3,得:(0.3+0.3+形)+(0.3/30+0.3/20+巧/10)得F3 = 0.36,即部件3的可改进比例为36%o(2)设系统改进前的执行时间为T,则3个部件改进前的执行时间为:(0.3+0.3+0.2) T = 0.8T,不可改进部分的执行时间为0.2T。已知3个部件改进后的加速比分别为Si = 30, S:=20, S3=10,因此3个部件改进后的执行时河为:匸 0.3T0.3T0.27 八心“Tn =+= 0.047302010改进后整个系统的执行时间为:Til = 0.045T+0.2T = 0.245T 那么系统中不町改进部分的执行时间在总执行时间中占的比例是:0.2T0.2457-= 0.823.12有一指令流水线如卜

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号