体系结构作业解题参考

上传人:cl****1 文档编号:511535096 上传时间:2023-04-16 格式:DOC 页数:11 大小:178.51KB
返回 下载 相关 举报
体系结构作业解题参考_第1页
第1页 / 共11页
体系结构作业解题参考_第2页
第2页 / 共11页
体系结构作业解题参考_第3页
第3页 / 共11页
体系结构作业解题参考_第4页
第4页 / 共11页
体系结构作业解题参考_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《体系结构作业解题参考》由会员分享,可在线阅读,更多相关《体系结构作业解题参考(11页珍藏版)》请在金锄头文库上搜索。

1、体系结构作业解题参考第1章习题6某处理机时钟频率为f=30MHz,处理速度为20MIPS,用它来执行一个已知混合程序。假定每次存储器访问延迟时间为1个时钟周期。问: 此处理机的有效CPI是多少? 假定新处理机的时钟频率f提高到60MHz,但存储子系统速率不变。这样,每次存储器访问需2个时钟周期。如果30%的指令每条只需要1次访存,而另外5%指令每条需2次访存,且假定已知混合程序的指令数不变,并与原处理机兼容,请定量分析改进后的新处理机性能。解: 由得 设已知混合程序的总指令执行数为IC,则改进前程序执行所需的总时钟周期数NCO为而改进后的混合程序的指令数不变,且每次访存需增加1个时钟周期,故改

2、进后程序执行所需的总时钟周期数NCn为所以,改进后,处理机的有效CPI为故改进后的处理机速度为第2章习题6一条线性流水线有4个流水段,每个流水段的延迟时间都为t。开始5个t,每间隔一个t向流水线输入一个任务,然后停顿2个t,如此重复。 画出流水线的时空图。 求流水线的实际吞吐率、加速比和效率。解: 时空图如下: 设流入流水线的任务总数为n,若以5个任务为一组,则共可分为组。由于两组任务之间间隔2个时钟周期,所以完成n个任务的总时间为所以有 , , 。7用一条5个流水段的浮点加法流水线计算 。每个流水段的延迟时间均相等,流水线的输出端与输入端之间有直接数据通路,而且设置有足够的缓冲寄存器。要求用

3、尽可能短的时间完成计算,画出流水线时空图,计算流水线的P、S、E值。解:流水线时空图如下由时空图可知,完成全部计算共用了21t,共执行了9次加法运算。所以 , , 。10在一台流水线处理机上执行下面程序。每条指令都要经过“取指”、“译码”、“执行”、“写结果”4 个流水段,每个流水段延迟时间都是5ns。但在“执行”流水段LS部件和ALU部件只能其中一个工作,其中LS部件完成LOAD和STORE操作,ALU部件完成其它操作。这两个操作部件的输出端和输入端有直接输出通路相互切换连接,且ALU部件产生的条件码也能直接送入控制器。 I1 SUB R0,R0 I2 LOAD R1,#8 I3 LOOP:

4、LOAD R2,A(R1) I4 MUL R2,R1 I5 ADD R0,R2 I6 DNE R1 LOOP I7 STORE R0,M(X)假定采用静态分支预测技术,每次都预测转移不成功。要求: 画出指令流水线的时空图。 计算流水线的吞吐率和加速比,并分别计算译码部件和ALU部件的使用效率。解: 时空图如下: , , , 。第3章习题7第6题中假设所有运算型指令都在译码(ID)段读寄存器,在写结果(WB)段写寄存器,采用顺序发射顺序完成的调度策略。 画出流水线执行指令序列的时空图。 计算执行这个程序所用的时间。I1 LOAD R0,M(A)I2 ADD R1,R0I3 LOAD R2,M(B

5、)I4 MUL R3,R4I5 AND R4,R5I6 ADD R2,R5解: 执行时间=10ns11=110ns .8第6题中假设所有运算型指令都在译码(ID)段读寄存器,在写结果(WB)段写寄存器,采用顺序发射乱序完成的调度策略。 画出流水线执行指令序列的时空图。 计算执行这个程序所用的时间。解: 执行时间=10ns10=100ns .9第6题中假设每个操作部件的输出端都有直接数据通路与输入端相连,采用顺序发射乱序完成的调度策略。 画出流水线执行指令序列的时空图。 计算执行这个程序所用的时间。解: 执行时间=10ns8=80ns .11解:两种静态指令调整方案的时空图如下:第4章习题3解:

6、 向量链接图如下 T=(1+7+1)+(1+3+1)+(1+4+1)+(1+2+1)+(64-1)=87(拍)。 流过时间=1+7+1+1+3+1+1+4+1+1+2+1=24(拍)。4解: 第1、2两条指令并行执行,然后与第3条指令链接,第4条指令顺序执行。 T=(1+6+1)+(1+7+1)+(32-1)+(1+6+1)+(32-1)=87(拍)。5 V0存储器V1V2+V3V4V5*V6 3条指令全并行执行,总时间为T=(1+7+1)+(32-1)=40(拍) V2V0*V1V3存储器V4V2+V3第1、2条指令并行执行,第3条指令顺序执行。总时间为T=(1+7+1)+(32-1)+(1

7、+6+1)+(32-1)=79(拍) V0存储器 V11/V0 V3V1+V2 V5V3*V44条指令全部链接执行。总时间为T=(1+6+1)+(1+14+1)+(1+6+1)+(1+7+1)+(32-1)=72 V0存储器 V1V2+V3 V4V5*V6 S0S1+S24条指令全部并行执行。总时间为T=(1+7+1)+(32-1)=40(拍) V3存储器 V2V0+V1 V3V2*V1 V5V3*V4第1、2条指令并行执行,第3、4条指令均顺序执行。总时间为T=(1+6+1)+(32-1)+(1+7+1)+(32-1)+(1+7+1)+(32-1)=1197某机有16个向量寄存器,其中V0V

8、5分别放有A、B、C、D、E、F,向量长度均为32,向量各元素均为浮点数;处理部件采用两个单功能流水线,加法功能部件时间为2拍,乘法功能部件时间为3拍。采用链接技术,先计算(A+B)*C,在流水线不停顿的情况下,接着计算(D+E)*F。 设寄存器入/出各需1拍,此链接流水线的流过时间为多少拍? 假设每拍为50ns,完成这些计算并把结果存入相应寄存器,此部件的实际吞吐率是多少MFLOPS?解:写出向量操作序列如下:V6V0+V1V7V6*V2V8V3+V4V9V8*V5显然可将第1、2两条指令链接,第3、4两条指令链接;且第2组操作紧随第1组操作流入流水线,使流水线不停顿。 流过时间=1+2+1

9、+1+3+1=9(拍)。 总时间T=(1+2+1)+(1+3+1)+(64-1)* 50ns =3600ns , 完成的浮点运算总次数N=2*64=128,所以,该部件的实际吞吐率为8在某向量机上计算D=A*(B+C),设A、B、C均为长度为128的向量,并已存放在相应寄存器中,都利用浮点功能部件和链接技术。该机向量寄存器长度为64。 完成计算任务所需要的最短时间为多少拍? 实际吞吐率是多少MFLOPS?解:本题的向量需要分两段处理,每段长度均为64。设各向量存放的向量寄存器为:A存于V0和V1,B存于V2和V3,C存于V4和V5,D存于V6和V7,且该机有足够的向量寄存器。则完成计算所需的操

10、作序列如下:V8V2+V4V6V0*V8V8V3+V5V7V1*V8 显然可将第1、2两条指令链接,第3、4两条指令链接。设加法功能部件时间为6拍,乘法功能部件时间为7拍,向量寄存器入/出各需1拍,则总时间为T=(1+6+1)+(1+7+1)+(64-1)*2=160(拍) 完成计算任务所做的浮点操作总次数为N=2*128=256。设该机的时钟频率为f,则其实际吞吐率为4设E为交换函数,S为均匀洗牌函数,B为蝶式函数,PM2I为移数函数,函数的自变量是十进制数表示的处理机编号。现有32台处理机,其编号为0,1,2,31. 分别计算下列互连函数: E2(12) S(8) B(9) PM2I+3(

11、28) E0(S(4) S(E0(18) 用E0和S构成均匀洗牌交换网(每步只能使用E0和S一次),网络直径是多少?从5号处理机发送数据到7号处理机,最短路径要经过几步?请列出经过的处理机编号。 采用移数函数构成互连网,网络直径是多少?结点度是多少?与2号处理机距离最远的是几号处理机?解: E2(12)E2(01100)(01000)28, S(8)S(01000)(10000)216, B(9)B(01001)(11000)224, PM2I+3(28)28+23 mod 32=4, E0(S(4)E0(S(00100)E0(01000)(01001)29, S(E0(18)S(E0(100

12、10)S(10011)(00111)27. 依题意,均匀洗牌交换网的互连函数设计为:S(E0(X)。 S(E0(00000)00010,S(E0(00001)00000, S(E0(00010)00110,S(E0(00011)00100, S(E0(00100)01010,S(E0(00101)01000, S(E0(00110)01110,S(E0(00111)01100, S(E0(01000)10010,S(E0(01001)10000, S(E0(01010)10110,S(E0(01011)10100, S(E0(01100)11010,S(E0(01101)11000, S(E0

13、(01110)11110,S(E0(01111)11100, S(E0(10000)00011,S(E0(10001)00001,S(E0(10010)00111,S(E0(10011)00101,S(E0(10100)01011,S(E0(10101)01001,S(E0(10110)01111,S(E0(10111)01101,S(E0(11000)10011,S(E0(11001)10001,S(E0(11010)10111,S(E0(11011)10101,S(E0(11100)11011,S(E0(11101)11001,S(E0(11110)11111,S(E0(11111)11101。以上互连关系用图形描述如下:026143031292517134102215282721916581871226231324191120所以有:网络直径=;从5号结点发送数据到7号结点,最短路径要经过3步,即58187。 采用移数函数构成互连网,结点间的互连关系是:PM2+0:(0 1 2 3 29 30 31)PM2-0:(31 30 29 28 2 1 0)PM2+1:(0 2 4 6

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 试题/考题 > 初中试题/考题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号