第一章作业答案概要

上传人:我*** 文档编号:137681002 上传时间:2020-07-11 格式:PPT 页数:38 大小:375.50KB
返回 下载 相关 举报
第一章作业答案概要_第1页
第1页 / 共38页
第一章作业答案概要_第2页
第2页 / 共38页
第一章作业答案概要_第3页
第3页 / 共38页
第一章作业答案概要_第4页
第4页 / 共38页
第一章作业答案概要_第5页
第5页 / 共38页
点击查看更多>>
资源描述

《第一章作业答案概要》由会员分享,可在线阅读,更多相关《第一章作业答案概要(38页珍藏版)》请在金锄头文库上搜索。

1、第一章,1 、用一台40MHz处理机执行标准测试程序,它含的混合指令数和相应所需的时钟周期数如下:,求有效CPI、MIPS速率和程序的执行时间,解:CPI=145%+232%+215%+28% =1.55时钟周期 MIPS=Rc/(CPI*106)=(40*106)/ (1.55*106 )=25.81(百万次/秒) T=INCPITc =1051.55(1/40106) =3.875ms,2、假定要在一个时钟速率为40MHz处理机上执行200000条指令的目标代码,程序主要由四种指令组成。根据程序跟踪实验结果,已知指令混合比和每种指令所需的指令数如下:,要求计算: (1) 在单处理机上用上述

2、跟踪数据运行程序的平均CPI。 (2) 根据(1)所得到的CPI值,计算相应的MIPS速率。,答案: Rc=40*106 IN =2* 105条 (1) CPI=1*0.6+2*0.18+4*0.12+8*0.1=2.24 (2) MIPS= Rc/(CPI*106)=(40*106 )/ (2.24*106 )=17.86(百万次/秒),1、某模型机有8条指令,使用频率分别为:0.3,0.3,0.2,0.1,0.05,0.02,0.02,0.01。试分别用霍夫曼编码和扩展编码对其操作码进行编码,限定扩展编码只能有两种长度。则它们的平均编码长度各比定长操作码的平均编码长度减少多少?,1、假设在

3、一个采用组相联映象方式的Cache中,主 存由B0B7共8块组成,Cache有2组,每组2块,每块的大小为16个字节,采用LFU块替换算法。在一个程序执行过程中依次访问这个Cache的块地址流如下: 6,2,4,1,4,6,3,0,4,5,7,3 (1) 写出主存地址的格式,并标出各字段的长度。 (2) 写出Cache地址的格式,并标出各字段的长度。 (3) 画出主存与Cache之间各个块的映象对应关系。 (4) 如果Cache的各个块号为C0、C1、C2和C3,列出程序执行过程中Cache的块地址流情况。 (5) 如果采用FIFO替换算法,计算Cache的块命中率。 (6)采用LFU替换算法

4、,计算Cache的块命中率。,(1)主存地址:,6 5 4 3 0,(2) 缓存地址:,5 4 3 0,区号Ei,块号Bi,缓存块号bi,3 2 1 0,相关存储器的格式:,相关存储器的容量,应与缓存的块数相同, 即: 组数组内块数=22 = 22=4个存储单元。,解:,(3)对应关系:,装入位,时间t 1 2 3 4 5 6 7 8 9 10 11 12 块地址流 6 2 4 1 4 6 3 0 4 5 7 3,6,6,6,6,6,1,6,0,6,6,5,7,LFU,调进,调进,调进,替换,替换,替换,4,4,1,1,4,4,1,4,4,0,6,4,4,5,4,命中,命中,命中4次,7,5,

5、4,C1,C2,C0,C3,2,2,2,6,2,2,3,3,3,3,3,3,调进,命中,命中,替换,Cache的块地址流情况: C2 C3 C0 C1 C0 C2 C3 C1 C0 C1 C2 C3,命中率H=4/12=33.3%,时间t 1 2 3 4 5 6 7 8 9 10 11 12 块地址流 6 2 4 1 4 6 3 0 4 5 7 3,6,6,6,6,6,1,3,1,3,3,4,3,FIFO,调进,调进,调进,替换,替换,替换,4,4,1,1,4,4,1,4,0,4,3,0,5,4,5,命中,命中3次,3,4,5,C1,C2,C0,C3,2,2,2,6,2,2,2,2,2,2,7

6、,7,调进,命中,命中,替换,替换,命中率H=3/12=25%,2、假设机器的时钟周期为10ns,Cache失效时的访存时间为20个时钟周期,Cache的访问时间为一个时钟周期。 (1) 设失效率为0.05,忽略写操作时的其它延迟,求机器的平均访存时间。 (2) 假设通过增加Cache容量一倍而使失效率降低到0.03,但使得Cache命中时的访问时间增加到了1.2时钟周期(即12ns),指出这样的改动设计是否合适? (3) 如果时钟周期取决于Cache的访问时间(也就是用延长时钟周期的方法),上述改动设计是否合适?,答案: (1)机器的平均访存时间 T=TcHc+(1-Hc)Tm=0.9510

7、+0.052010 =19.5ns (2)T=TcHc+(1-Hc)Tm =0.97101.2+0.032010 =17.64ns 这种改动合适,使机器的平均访存时间降低。 (3)T=TcHc+(1-Hc)Tm =0.97101.2+0.0320101.2 =18.84ns 合适。,1、若有一静态多功能流水线分为6段,如下图所示,其中乘法流水线由1、2、3、6段组成,加法流水线由1、4、5、6段组成。使用流水线时,要等某种功能(如加法)操作都处理完毕后才能转换成另一种功能(如乘法)。 若要计算:AB=(a1+b1)(a2+b2)(a3+b3) 问:(1)在上述流水方式下,完成AB需多少时间?画

8、出时空图并计算此流水线的使用效率和吞吐率。 (2)与顺序运算方式相比,加速比为多少?, 2,T,解: (1),1,2,3,4,1,2,3,4,4,5,5,5,1,2,3,1,2,3,19 ,S,6,1,2,3,4,5,4,5,完成A*B需要的时间=19 ,效率为:,吞吐率为:,(2)加速比为:,2、已知某单功能非线性流水线的预约表如下图,要求: (1)列出禁止表F和冲突向量C。 (2)画出该流水线状态图,确定其最小平均延迟以及此时的调度方案? 当按此流水调度方案共输入8个任务时,则其实际吞吐率为多少?,附图,解:(1)禁止表F=4 冲突向量 C=(1000) (2)最佳调度策略(1,1,1,5

9、) 吞吐率=8/17t,=5,=5,=5,=5,=5,=5,=5,=5,1,2,3,2,3,3,1,3,2,1,1,2,各种调度方案及其相应的平均延迟:,3、有一个双输入端的加-乘双功能静态流水线,由经过时间为t、t、2t、t的1、2、3、4四个子过程构成。加按1 2 4连接,乘按1 3 4连接,流水线输出设有数据缓冲器,也可将数据直接返回输入。现要执行 A*(B+C*(D+E*F)+G*H 的运算,请调整计算顺序,画出能获得吞吐率尽量高的流水时空图,标出流水线入、出端数据的变化情况,求出完成全部运算的时间及此期间整个流水线吞吐率,效率,加速比?如对流水线瓶颈子过程再细分,最少只需多少时间可完

10、成全部运算?若子过程3不能再细分,只能用并联方法改进,问流水线的效率为多少?,解:根据题意,对算法经调整后,能使流水吞吐率尽量高的流水时空图如图所示。图中已标出了流水线入、出端的数据变化情况。,S,1,2,3,4,1,2,1,2,1,2,3,3,3,1,2,3,4,5,6,4,5,4,5,6,6,4,5,6,7,8,7,8,7,8,9,9,9,输入,输出,AC,EF,AB,GH,ACD,ACEF,AB ACD,ACEF GH,ACEF+GH ACD+AB,AC,EF,AB,GH,ACD,ACEF,ACD+AB,ACEF+GH,ACEF+GH+ACD+AB,21t,S,1,2,31,32,1,2

11、,1,3,2,4,3,5,6,4,5,6,7,8,7,8,7,8,9,9,9,根据上图的流水时空图,可以看出,完成全部运算的时间为21t。,如果现在将瓶颈子过程3细分成两个子过程,则时空图如下图所示。,4,1,3,2,4,5,6,1,3,2,4,5,6,16t,S,1,2,31,32,1,2,1,3,1,3,3,5,5,4,5,6,7,8,7,8,7,8,9,9,9,4,2,4,2,4,6,6,1,3,2,4,5,6,16t,由上图可见,完成全部运算最少需要16t的时间即可。 现在若子过程3不能再细分了,只能用2个子过程3通过并联来改进,则其时空图如下图所示。,完成全部运算时的流水线效率,4、

12、超级标量机和超级流水线机都能开发指令级的并行性,现假定这两种机器的流水线都为4段,每段均需1个时钟周期。若在超级标量机中,每个时钟周期可同时启动3条指令,而超级流水线机中则是每隔1/3时钟周期启动一条指令。现若要执行6条指令的代码序列,问在两种机器上各需用多少个时钟周期方可执行完毕? 解:超级标量机需5个时钟周期,超级流水线机需5.67个时钟周期。,5、 在CRAY-1机上,V是向量寄存器,设向量长度均为32。S是标量寄存器,所用浮点功能执行部件的执行时间分别为:加法需6拍,相乘需7拍,从存储器读存数需6拍,求倒数近似值及除法需14拍,写入寄存器及启动功能部件(包括存储器)各需1拍。问下列各指

13、令组中的哪些指令可以链接?哪些指令不可链接?哪些指令可以并行执行?试说明其原因并分别计算出各指令组全部完成所需的拍数。 (1)V0存储器 (2)V2V0+V1 V1V2+V3 V3存储器 V4V5*V6 V4V2*V3 (3)V0存储器 (4) V0存储器 V3V1+V2 V11/V0 V4V0*V3 V3V1+V2 V6V4+V5 V5V3*V4 (5)V0存储器 (6) V3存储器 V1V2+V3 V2V0+V1 V4V5*V6 s0s2+s3 s0s1+s2 V3V1*V4 (7)V3存储器 (8) V0存储器 V2V0+V1 V2V0+V1 V4V2*V3 V3V1+V2 存储器V4

14、V5V3*V4,解:(1)三条指令可全并行执行,需(1+7+1)+(32-1)=40(拍) (2)前两条并行,和第三条链接,需(1+7+1)+(1+6+1)+(32-1)=48拍 (3)前两条并行和第三条链接,而第四条指令与第三条指令串行(因第二条和第四条功能部件冲突),需 (1+6+1)+(1+7+1)+(32-1)+(1+6+1) +(32-1) =87拍 (4)全部链接 (1+6+1)+(1+14+1)+(1+6+1)+(1+7+1)+(32-1)=72拍 (5)全并行执行,需(1+7+1)+(32-1)=40(拍) (6)前三条指令并行,与第四条指令串行(V1源操作数冲突),需 (1+

15、6+1)+(32-1)+(1+7+1)+(32-1)=79拍 (7)前两条指令并行,与第三条链接,再与第四条串行(因第一条和第四条冲突),需 (1+6+1)+(1+7+1)+(32-1)+(1+6+1)+(32-1)=87拍 (8)前两条指令链接,与第三条串行(V1源操作数冲突),与第四条链接,需 (1+6+1)+(1+6+1)+(32-1)+(1+6+1)+(1+7+1)+(32-1) =95拍,1、若有一静态多功能流水线分为6段,如下图所示,其中乘法流水线由1、2、3、6段组成,加法流水线由1、4、5、6段组成。使用流水线时,要等某种功能(如加法)操作都处理完毕后才能转换成另一种功能(如乘法)。 若要计算:AB=(a1+b1)(a2+b2)(a3+b3) 问:(1)在上述流水方式下,完成AB需多少时间?画出时空图并计算此流水线的使用效率和吞吐率。 (2)与顺序运算方式相比,加速比为多少?, 2,T,解: (1),1,2,3,4,1,2,3,4,4,5,5,5,1,2,3,1,2,3,19 ,S,6,1,2,3,4,5,4,5,完成A*B需要的时间=19 ,效率为:

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号