计算机系统结构第1

上传人:M****1 文档编号:471886496 上传时间:2023-07-15 格式:DOCX 页数:12 大小:157.65KB
返回 下载 相关 举报
计算机系统结构第1_第1页
第1页 / 共12页
计算机系统结构第1_第2页
第2页 / 共12页
计算机系统结构第1_第3页
第3页 / 共12页
计算机系统结构第1_第4页
第4页 / 共12页
计算机系统结构第1_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《计算机系统结构第1》由会员分享,可在线阅读,更多相关《计算机系统结构第1(12页珍藏版)》请在金锄头文库上搜索。

1、第一章某台主频为400MHz的计算机执行标准测试程序,程序中指令类型、执行数量和平均 时钟周期数如下:指令类型指令执行数量平均时钟周期数整数450001数据传送750002淫点80004分支15002求该计算机的有效CPI、MIPS和程序执行时间。解:(1) CPI =(45000X1 + 75000X2 + 8000X4+1500X2) / 129500=(嘿)(2) MIPS 速率=f/ CPI =400/ =(或5180 MIPS)(3)程序执行时间=(45000X1+75000X2+8000X4+1500X 2) / 400=575s假设某应用程序中有4类操作,通过改进,各操作获得不同

2、的性能提高。具体数据如 卜表所示:操作类型程序中的数量 (百万条指令)改进前的执行时间 (周期)改进后的执行时间 (周期)操作11021操作2302015操作335103操作41541(1) 改进后,各类操作的加速比分别是多少(2) 各类操作单独改进后,程序获得的加速比分别是多少(3) 4类操作均改进后,整个程序的加速比是多少解:根据Amdahl定律S =1 可得nFe(1 - Fe) + - Se操作类型各类操作的指令条数在 程序中所占的比例F.各类操作的加速比S.各类操作单独改进后, 程序获得的加谏比操作11%2操作2%操作3%操作4%44类操作均改进后,整个程序的加速比: 2.16第二章

3、变长编码,哈夫曼编码第三章有一条指令流水线如下所示:50ns50ns100ns200ns(1)求连续输入10条指令的情况下,该流水线的实际吞吐率和效率。(2)该流水线的瓶颈在哪一段请采用两种不同的措施消除此瓶颈。对于你所给出的两种新 的流水线,连续输入10条指令时,其实际吞吐率和效率各是多少解:(1)本题主要考察对各功能段用时不等的线性流水线的性能计算公式的掌握情况。T =r At. + (n- 1)Atmaxi=1=(50 + 50 +100 + 200) + 9 x 200=2200(ns)TP = nT= /220(ns -1)流水.于A LE = TP -且 I = TP -400 =

4、 5 a 45.45%k411注意:对于公式不能死记硬背,需要充分理解,注意公式的适用条件。(2)瓶颈在3、4段。变成八级流水线(细分瓶颈段方法)50ns卜 3_2 4_150ns 50ns 50ns 50ns出4_4 50nsT流水=50=zkA t. + (n-1) A tmax9 x 50=850(ns)TP = n T- 流水=%5(ns -1)产Atik817E = TP - 4=1 = TP -400 =10 a 58.82%重复设置瓶颈段方法TP= %=%5仙 一1) 流水E = 400 x %0 x 8 = 1017 -弭82%有一个流水线由4段组成,其中每当流过第三段时,总要

5、在该段循环一次,然后才能流到 第4段。如果每段经过一次所需的时间都是,问:(1)当在流水线的输入端连续地每时间输入一个任务时,该流水线会发生什么情况(2)此流水线的最大吞吐率为多少如果每2乙输入一个任务,连续处理10个任务时,其实 际吞吐率和效率是多少(3)当每段时间不变时,如何提高流水线的吞吐率人连续处理10个任务时,其吞吐率提高 多少解:(1)会发生流水线阻塞情况。(2)当任务流过第三段时要在该段循环一次,相当于要占用第三段2乙时间,则该流水 线可看成是具有瓶颈段的线性流水线,瓶颈段即第三段,所需时间为2。每2乙输入 一个任务,连续处理10个任务的时空图如下:2丛t则:TP =4max 2

6、At流水Tp =T = 23At10/ 1 一 /23At 流水E = TP -5A=就 54.35%(3) 重复设置部件。重复的部件可并联在流水线上,也可串联于流水线中。如下图所示:tT I_T 2 LI 3 1 |,3 2 L 4ttttt采用并联方式时的时空图如下:TP nT流水10, 5 /.14:7 A吞吐率提高倍数=7 At1023At有一条静态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5段,第3 段的时间为2,其余各段的时间均为,而且流水线的输出可以直接返回输入端或暂存于 相应的流水线寄存器中。现在该流水线上计算计(气+ B ),画出时空图,并计算其吞吐率、i

7、 1解:此题容易出的问题是忽略静态流水线的特点,当加法任务流入流水线后紧跟着启动乘 法任务。正确的做法是当所有加法任务完成从流水线流出后再启动乘法任务,同时还应注 意到流水线中的第三段所用时间为2Zto (1)任务分析口(耳+曷)=(A +坊x (也+民)心+ g +氏) (I(2)画时空图123123123412344567456756718乙(3)计算流水线性能n吞吐率:Tp = t =718A?S = T串行=4 x 5At + 3 x 3t = 29加速比:P 18At- 18流水效率:实际占用面积_ 4x5At + 3x3t _ 29时空区总面积5 x 18At90在CRAY-l机器

8、上,按照链接方式执行下述4条向量指令(括号中给出了相应功能部件时间), 如果向量寄存器和功能部件之间的数据传送需要1拍,试求此链接流水线的通过时间是多少 拍如果向量长度为64,则需多少拍才能得到全部结果。V0-存储器(从存储器中取数:7拍)V2V0+V1(向量加:3拍)V3V2VA3(按(A3)左移:4拍)V5V3AV4(向量逻辑乘:2拍)解:通过时间就是每条向量指令的第一个操作数执行完毕需要的时间,也就是各功能流 水线由空到满的时间,具体过程如下图所示。要得到全部结果,在流水线充满之后,向量中后继操作数继续以流水方式执行,直到整组向量执行完毕。甬甘=(7+1) + (1+3+1) + (1+

9、4+1) + (1+2+1)=23(拍) 通过T总共 T 通过+(64D=23+63=86(拍)说明:若考虑数据从存储器送访存部件也有1拍延迟,则通过时间应为24拍,完成全部任 务所用时间相应为87拍。某向量处理机有16个向量寄存器,其中V0-V5种分别存放有向量A,B,C,D,E,F向量的长度是 8,向量各元素均为浮点数;处理部件采用两个单功能流水线,加法功能部件时间为2拍,乘 法功能部件时间为3拍。采用类似CRAY-1的链接技术,先计算(A+B)XC,在流水线不停的情 况下,接着计算(D+E)XFo(1) 求此链接流水线的通过时间是多少拍(设寄存器出入各需1拍)(2) 假如每排时间为50n

10、s,完成这些计算并把结果存进相应寄存器,此处理部件的时间吞吐率为多少MFLOPS解:(1)我们在这里假设A+B的中间结果放在V6中,(A+B)XC地最后结果放在V7中,D + E地中间结果放在V8中,(D + E)XF的最后结果放在V9中。具体实现参考下图:通过时间应该为前者(A+B)XC)通过的时间:T 通过(1+2+1)+(1+3+1) =9 (拍)(2)在做完(A+B)XC之后,作(C + D)XE就不需要通过时间了。V6 = A + B;V7 = V6 * C;V8 = D + E;V9 = V8 * F;T = T通过b(8-D + 8 = 24(拍)=1200(ns) =1200X

11、10-9 (s)32题目中所问为吞吐率是多少MFLOPS,显然是让求以MFLOPS为单位的吞吐率。MFLOPS是 指每秒完成多少百万次浮点运算,因此要明确所有任务中共多少浮点运算。显然共有4条 浮点向量指令,而每条指令完成8个浮点运算,因此浮点运算总数为32个。所以:吞吐率:TP =浇 26.67 MFLOPSTe X 1061200 X 10-9 X 106第四章假设有一条长流水线,仅仅对条件转移指令使用分支目标缓冲。假设分支预测错误的开销 为4个时钟周期,缓冲不命中的开销为3个时钟周期。假设:命中率为90%,预测精度为 90%,分支频率为15%,没有分支的基本CPI为1。(1) 求程序执行

12、的CPI。(2) 相对于采用固定的2个时钟周期延迟的分支处理,哪种方法程序执行速度更快解:(1) 程序执行的CPI = CPI基本+分支延迟=1 + 15%X90%X(1-90%)X4 = (1-90%)X3(2) 采用固定的2个时钟周期延迟时,程序执行的CPI = CPI基本+分支延迟=1 + 15%X2显然采用分支目标缓冲器时程序执行时间更少,即速度更快。假设分支目标缓冲的命中率为90%,程序中无条件转移指令的比例为5%,没有无条件转移 指令的程序CPI值为1。假设分支目标缓冲中包含分之目标指令,允许无条件转移指令进入 分支目标缓冲,则程序的CPI值为多少假设无条件分支指令不进入分支目标缓

13、冲时程序执行 的CPI为解:无条件分支指令的特点是只要执行肯定分支成功。因此,对于进入分支目标缓冲器的 无条件分支指令,分支预测的精度为100%,也就不会带来分支延迟。而没有进入分支目标 缓冲器的无条件分支指令会带来一定分支延迟。首先要求出一条无条件分支指令的分支延 迟是多少,不妨设为x个时钟周期。由题知无条件分支指令不进入分支目标缓冲时程序执行的CPI为,而程序中没有无条件 转移指令的CPI为1,因此有CPI = CPI无分支指令+无条件分支延迟=1 + 5%x =所以x= 2因此,允许无条件分支指令进入分支目标缓冲器时,CPI = CPI 无分支指令+ 5%X(1-90%)X2 =第五章存储层次解释下列术语(不要求写在作业本上,但应作为复习内容)存储系统全相联映像直接映像组相联映像写直达法写回法按写分配法不按写分配法命中时间失效率强制性失效容量失效冲突失效2: 1经验规则相联度答:(答案略)简述“ Cache-主存”层次与“主存-辅存”层次的区别。答:存储层次 比较项目“Cache一主存”层次“主存一辅存”层次目的为了弥补主存速度的不足为了弥补主存容量的不足存储管理实现全部由专用硬件实现主要由软件实现访问速度的比值 (第一级比第二级)几比一几百比一典型的块(页)大小几十个字节几百到几千个字节CPU对

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号