计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录

上传人:小** 文档编号:55662884 上传时间:2018-10-03 格式:DOC 页数:139 大小:3.53MB
返回 下载 相关 举报
计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录_第1页
第1页 / 共139页
计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录_第2页
第2页 / 共139页
计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录_第3页
第3页 / 共139页
计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录_第4页
第4页 / 共139页
计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录_第5页
第5页 / 共139页
点击查看更多>>
资源描述

《计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录》由会员分享,可在线阅读,更多相关《计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录(139页珍藏版)》请在金锄头文库上搜索。

1、1计算机系统结构(第 2 版) 郑伟明 汤志忠 编著 清华大学出版社 习题解答21 目录1.1第一章(P33)1.7-1.9(透明性概念) ,1.12-1.18(Amdahl 定律) ,1.19、1.21、1.24(CPI/MIPS)1.2第二章(P124)2.3、2.5、2.6(浮点数性能) ,2.13、2.15(指令编码)1.3第三章(P202)3.3(存储层次性能) ,3.5(并行主存系统) ,3.15-3.15 加 1 题(堆栈模拟) ,3.19 中(3) (4)(6)(8)问(地址映象/替换算法-实存状况图)31.4第四章(P250)4.5(中断屏蔽字表/中断过程示意图) ,4.8(

2、通道流量计算/通道时间图)1.5第五章(P343)5.9(流水线性能/时空图) ,5.15(2 种调度算法)1.6第六章(P391)6.6(向量流水时间计算) ,6.10(Amdahl 定律/MFLOPS)1.7第七章(P446)7.3、7.29(互连函数计算) ,7.6-7.14(互连网性质) ,7.4、7.5、7.26(多级网寻径算 法) ,7.27(寻径/选播算法)41.8第八章(P498)8.12(SISD/SIMD 算法)1.9第九章(P562)9.18(SISD/多功能部件/SIMD/MIMD 算法)(注:每章可选 1-2 个主要知识点,每个知识点可只选 1 题。有下划线者为推荐的

3、主要知 识点。)52 例, 习题2.1第一章(P33)例 1.1,p10假设将某系统的某一部件的处理速度加快到10倍,但该部件的原处理时间仅为整个运行时间的40%,则采用加快措施后能使整个系统的性能提高多少? 解:由题意可知:Fe=0.4, Se=10,根据 Amdahl 定律 SeFeFeTToS nn )1(156.164.01104.06.01 nS6例 1.2,p10采用哪种实现技术来求浮点数平方根 FPSQR 的操作对系统的性能影响较大。假设 FPSQR 操作占整个测试程序执行时间的 20%。一种实现方法是采用 FPSQR 硬件,使 FPSQR 操作 的速度加快到 10 倍。另一种实

4、现方法是使所有浮点数据指令的速度加快,使 FP 指令的速 度加快到 2 倍,还假设 FP 指令占整个执行时间的 50%。请比较这两种设计方案。 解:分别计算出这两种设计方案所能得到的加速比:SeFeFeTToS nn )1(1Fe FPSQR=0.20,Se FPSQR=10 Fe FP=0.50,Se FP=233. 175. 0125 . 0)5 . 01 (122. 182. 01102 . 0)2 . 01 (1 FPFPSQRSnSn7例 1.3,p11如果 FP 操作的比例为 25%,FP 操作的平均 CPI=4.0,其它指令的平均 CPI 为 1.33,FPSQR 操作的比例为

5、2%, FPSQR 的 CPI 为 20。假设有两种设计方案,分别把 FPSQR 操作的 CPI 和所有 FP 操作的 CPI 减为 2。试利用 CPU 性能公式比较这两种设计方案哪一个更好(只改 变 CPI 而时钟频率和指令条数保持不变)。 解: nii iICICPICPI1)(原系统的CPIFP=4.0, =25%ICIFPCPI2=1.33, =1-25%ICI2CPI原 nii iICICPI1)(= CPIFP + CPI2ICIFP ICI2=4.025% + 1.3375%8=2方案 1(使 FPSQR 操作的 CPI 为 2)系统 CPI=CPI原 - CPIFPSQR 原

6、+ CPIFPSQR 新ICIFPSQRICIFPSQR=CPI原 - (CPIFPSQR 原 - CPIFPSQR 新)ICIFPSQR=2-2%(20-2)=1.64方案 2(提高所有 FP 指令的处理速度, 使 FPSQR 操作的 CPI 为 2)CPI=CPI原 - CPIFP 原 + CPIFP 新ICIFP ICIFP=CPI原 - (CPIFP 原 - CPIFP 新)ICIFP=2-25% (4-2)=1.5 我们也可以根据以下公式计算出方案 2 系统(同求 CPI原)CPI= 75%1.33+25%2=1.59显然,提高所有 FP 指令处理速度的方案要比提高 FPSQR 处理

7、速度的方案要好。 方案 2 的加速比性能没有采用改进措施前的采用改进措施后的性能加速比 2方案原系统 时间时间 CPUCPU TToSnn2CPI ICCPI IC方案原系统 时钟周期时钟周期 2CPICPI方案原系统=2/1.5 =1.33例 1.4假设两台机器的指令系统中,执行条件转移指令需 2 个时钟周期,而其它指令只需 1 个时 钟周期。 CPUA:采用一条比较指令来设置相应的条件码,由紧随其后的一条转移指令对此条件码进行10测试,以确定是否进行转移。显然实现一次条件转移要执行比较和测试两条指令。条件转 移指令占总执行指令条数的 20%。由于每条转移指令都需要一条比较指令,所以比较指令

8、 也将占 20%。 CPUB采用比较功能和判别是否实现转移功能合在一条指令的方法,这样实现一条件转移就 只需一条指令就可以完成。由于 CPUB在转移指令中包含了比较功能,因此它的时钟周期就 比 CPUA要慢 25%。 现在要问,采用不同转移指令方案的 CPUA和 CPUB,那个工作速度会更快些? 解:CPIA=0.22+0.81=1.2 TCPUA=ICA1.2tA = 1.2 ICAtACPUB转移指令占 20%80%=25%CPIB = 0.252+0.751=1.25 由于 CPUB中没有比较指令,因此ICB = 0.8ICA CPUB时钟周期就比 CPUA要慢 25%tB = 1.25

9、tATCPUB = ICBCPIBtB = 0.8 ICA1.251.25tA 11= 1.25 ICAtATCPUATCPUB 所以 CPUB比 CPUA运行得更快些。12例 1.A1计算 Pentium II 450(IPC2)处理机的运算速度。 解: 由于 PentiumII 450 处理机的 IPC2 (或 CPI0.5) Fz450MHz, MIPSPentium II 450FzIPC450 MHz2900(MIPS)例 1.A2我国最早研制的小型计算机 DJS-130,定点 16 位,加法每秒 50 万次,但没有硬件乘法和 除法指令,用软件实现乘法和除法,速度低 100 倍左右。

10、求等效速度。 解:定点等效速度为:661010 CPIMIPS时钟频率执行时间指令条数等效指令速度()MIPS1/0.80 0.50.20 0.5/1000.02MIPS即每秒 2 万次,由于乘法和除法用软件实现,等效速度降低了 25 倍。13例 1.A3假设在程序中浮点开平方操作 FPSQR 的比例为 2,它的 CPI 为 100;其他浮点操作 FP 的 比例为 23,它的 CPI 4.0;其余 75指令的 CPI1.33,计算该处理机的等效 CPI。 如果 FPSQR 操作的 CPI 也为 4.0,重新计算等效 CPI。 解: nii iICICPICPI1)(等效 CPI10024231

11、.3375 3.92 等效 CPI24251.3375 2.001.1解释下列术语 层次结构,计算机系统结构,计算机组成,计算机实现,透明性,由上而下设计,由下而 上设计,由中间向两边设计,软件兼容,向上兼容,固件,系列机,兼容机,模拟,仿真, 虚拟机,宿主机,指令流,数据流,单指令流单数据流,多指令流多数据流,Amdahl 定 律,CPI,MIPS,MFLOPS。141.2每一级为了执行一条指令需要下一级的 N 条指令解释,若执行第一级的一条指令需 kns, 那么执行第 2 级、第 3 级、第 4 级的指令需要多少时间? 第 1 级 1 条 1 级指令 k ns 第 2 级 1 条 2 级指

12、令 N 条 1 级指令 1Nk ns = Nk ns 第 3 级 1 条 3 级指令 N 条 2 级指令 1NNk ns = N2k ns 第 4 级 1 条 4 级指令 N 条 3 级指令 1NNNk ns = N3k ns1.4每一级指令能完成下一级的 M 条指令的工作量,且每一级指令需要下一级的 N 条指令解释, 若执行第一级的一条指令需 kns,那么执行第 2 级、第 3 级、第 4 级的等效程序需要多少 时间? 第 1 级 1 条 1 级指令 k ns 第 2 级 等效程序为 1/M 条 2 级指令 需 N/M 条 1 级指令解释 N/Mk ns 第 3 级 等效程序为 1/M/M

13、条 3 级指令 需 NN/M/M 条 1 级指令解释 N2/M2 ns 第 4 级 等效程序为 1/M/M/M 条 4 级指令 需 NNN/M/M/M 条 1 级指令解释 N3/M3 ns1.6试以实例说明计算机系统结构、计算机组成与计算机实现之间的相互关系与相互影响。15系统结构、组成和实现是三个不同的概念,它们各自包含不同的内容,但又有紧密的关系。以存储系统为例,主存储器容量和寻址方式的确定属计算机系统结构,主存的速度应多高, 在逻辑结构上采用什么措施属计算机组成,而主存的物理实现,如存储器采用什么样器件, 逻辑电路设计和微组装技术则属计算机实现。1.7什么是透明性概念?对计算机系统结构,

14、下列哪些是透明的?哪些是不透明的? 存贮器的模 m 交叉存取;透明(组成) 浮点数据表示;不透明(系统结构) I/O 系统是采用通道方式还是 I/O 处理机方式;不透明 数据总线宽度;透明(组成) 阵列运算部件;透明(组成) 通道是采用结合型的还是独立型的;透明(组成) PDP-11 系列中的单总线结构;不透明(系统结构) 访问方式保护;不透明(系统结构) 程序性中断;不透明(系统结构)16串行、重叠还是流水控制方式;透明(组成) 堆栈指令;存贮最小编址单位;不透明(系统结构) Cache 存贮器。透明(组成)(1)从指定角度来看,不必要了解的知识称为透明性概念。 (2)见下表, “”为透明性

15、概念。1.8从机器(汇编)语言程序员看,以下哪些是透明的? 指令地址寄存器;指令缓冲器;时标发生器;条件码寄存器;乘法器;主存地址 寄存器;磁盘外设;先行进位链;移位器;通用寄存器;中断字寄存器。见下表, “”为透明性概念模 m 交叉,浮点数据,P4通道与 I/O 处理机,P4 总线宽度,阵列运算部件,结合型与独立型通道, 单总线,访问保护,中断, 指令控制方式,堆栈指令,最小编址单位, Cache 存储器,指令地址寄存器,指令缓冲器,时标发生器, 条件码寄存器,乘法器,主存地址寄存器, 磁盘,先行进位链,移位器, 通用寄存器 ,中断字寄存器,171.9见下表, “”表示都透明, “应”表示仅对应用程序员透明, “”表示都不透明。1.12如果某一计算任务用向量方式求解比用标量方式求解要快 20 倍,称可用向量方式求解部 分所花费时间占总的时间的百分比为可向量化百分比。请画出加速比与可向量化比例两者 关系的曲线。 解:可向量化百分比为 Fe, Se=20,根据 Amdahl 定律 SeFeFeTToS nn )1(1将 Se 代入 Amdahl 定律得数据通路宽度,虚拟存储

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号