计算机系统结构期末复习

资源描述

《计算机系统结构期末复习》由会员分享，可在线阅读，更多相关《计算机系统结构期末复习（22页珍藏版）》请在金锄头文库上搜索。

1、第一章计算机系统结构定义计算机软件硬件（+网络）两种定义：定义1：Amdahl于1964年在推出IBM360系列计算机时提出：程序员所看到的计算机系统的属性，即概念性结构和功能特性定义2：计算机系统结构主要研究软硬件功能分配和对软硬件界面的确定计算机系统的多级层次模型第6级专用应用语言机器特定应用用户（使用特定应用语言）（经应用程序翻译成高级语言）第5级通用高级语言机器高级语言程序员（使用通用高级语言）（经编译程序翻译成汇编语言）第4级汇编语言机器汇编语言程序员（使用汇编语言）（经汇编程序翻译成机器语言、操作系统原语）第3级操作系统语言机器操作系统用户（使用操作系统原语）（经原语解释子

2、程序翻译成机器语言）第2级传统机器语言机器传统机器程序员（使用二进制机器语言）（由微程序解释成微指令序列）第1级微指令语言机器微指令程序员（使用微指令语言）（由硬件译码器解释成控制信号序列）第 0 级硬联逻辑硬件设计员第0级由硬件实现，第1级由微程序实现，第2级至第6级由软件实现，由软件实现的机器称为：虚拟机从学科领域来划分：第0和第1级属于计算机组织与结构，第3至第5级是系统软件，第6级是应用软件。它们之间仍有交叉。第0级要求一定的数字逻辑基础；第2级涉及汇编语言程序设计的内容；第3级与计算机系统结构密切相关。在特殊的计算机系统中，有些级别可能不存在。计算机组成：是计算机系统结构的逻辑

3、实现确定数据通路的宽度确定各种操作对功能部件的共享程度确定专用的功能部件确定功能部件的并行度设计缓冲和排队策略设计控制机构确定采用何种可靠性技术计算机实现：是指计算机组成的物理实现处理机、主存储器等部件的物理结构器件的集成度和速度专用器件的设计器件、模块、插件、底版的划分与连接信号传输技术电源、冷却及装配技术，相关制造工艺及技术等计算机系统结构、计算机组成和计算机实现是三个不同的概念。系统结构是计算机系统的软硬件的界面；计算机组成是计算机系统结构的逻辑实现；计算机实现是计算机组成的物理实现。他们各自包含不同的内容，但又有紧密的联系。组成和实现的改进推动系统结构的进步。Amdahl 定律：（定量

4、原理）系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占执行时间的比例有关。加速比公式：Sn=T0/Tn=1/(1-Fe)+Fe/Se) (应该大于 1)加速比受 Fe 的限制，它越大就越有可能获得更大加速比例子：书 10 页例 1.1 和 1.2CPU 性能公式：Te=IC*CPI*CYCLE；例子：11 页例 1.3计算机系统结构的分类方法：Flynn 分类（按照指令流和数据流的多倍性特征对计算机系统进行分类）冯氏分类（用最大并行度来对计算机系统进行分类）、Handler 分类计算机系统设计的主要方法：由下往上、由上往下、由中间开始设计计算机系统结

5、构评价标准MIPS=指令条数/（指令执行时间*106）=Fz/CPI=Fz*IPCIPC 为每个时钟周期平均执行的指令条数例1：计算PentiumII 450处理机的运算速度。解：由于PentiumII 450处理机的IPC 2（或CPI0.5），Fz450MHzMIPS=FZ*IPC=2*450=900MIPS等效指令速度MIPS等效CPIWi：指令使用频度。通常：加、减法50，乘法15，除法5，程序控制15，其它15%例2：我国最早研制的小型计算机DJS-130，定点16位，加法速度每秒50万次，但没有硬件乘法和除法等指令。用软件实现乘法和除法，速度降低100倍左右，求定点等效速度。解：M

6、IPS=1/(0.8/0.5)+(0.2/0.005)=0.02MIPS即每秒2万次，由于乘法和除法用软件实现，等效速度降低了25倍。例3 如果浮点开平方操作FPSQR 的比例为2%，它的CPI为100，其他浮点操作的比例为23%，它的CPI4.0，其余指令的CPI1.33，计算该处理机的等效 CPI。如果FPSQR操作的CPI 也为4.0，重新计算等效CPI。解：等效 CPI1100 2 4 231.33 75 3.92等效CPI24 251.33 752.00由于改进了仅占2的FPSQR 操作的CPI，使等效速度提高了近一倍第二章数据表示+数据结构=数据类型操作码的优化表示：定长编码、HU

7、FFMAN 编码、扩展编码（*课后题*）复杂指令系统计算机CISC：增强指令功能，设置功能复杂的指令；面向目标代码、面向高级语言、面向操作系统；用一条指令代替一串指令RISC精简指令系统计算机：简化指令功能，只保留功能简单的指令；较复杂的功能用子程序来实现较复杂的功能用子程序来实现RISC的思想精华：减少指令平均执行周期数（CPI ）RISC的特点(1) 简单而统一格式的指令译码。(2) 大部分指令可以单周期执行完成。(3) 只有LOAD和STORE指令可以访问存储器。(4) 简单的寻址方式。 (5) 采用延迟转移技术。(6) 采用LOAD延迟技术。RISC的关键技术1、延时转移技术（名词）

8、定义：为了使指令流水线不断流，在转移指令之后插入一条有效的指令，而转移指令被延迟执行，这种技术称为延迟转移技术。采用指令延迟转移技术时，指令序列的调整由编译器自动进行。采用延迟转移技术的两个限制条件(1)被移动指令在移动过程中所经过的指令之间不能有数据相关(2)被移动的指令不破坏条件码，至少不影响后面的指令使用条件码如果找不到符号条件的指令，必须在条件转移指令后面插入空操作如果指令的执行过程分为多个流水段，则要插入多条指令2、指令取消技术原因：采用指令延时技术，在许多情况下找不到可以用来调整的指令向后转移（循环程序）实现方法：循环体的第一条指令经调整后安排在两个位置，第一个位置是在

9、循环体的前面，第二个位置安排在循环体的后面，如果转移成功，则执行循环体后面的指令，然后返回到循环体开始；否则，则取消循环体后面的指令，继续执行后面的指令3、重叠寄存器窗口技术（Overlapping Register Window）原因：RISC中，子程序比 CISC中多，因传送参数而访存的信息量很大美国加洲大学伯克利分校的F Baskett提出实现方法：设置一个数量比较大的寄存器堆，并把它划分成很多个窗口。在每个过程使用的几个窗口中有一个窗口是与前一个过程共用，还有一个窗口是与下一个过程共用。效果：可以减少大量的访存操作。当寄存器溢出时，要在主存中开辟一个堆栈4、指令流调整技术目标

10、：通过变量重新命名消除数据相关，提高流水线效率5、以硬件为主固件为辅固件的主要缺点是：执行速度低主要优点是：便于实现复杂指令，便于修改指令系统RISC主要采用硬联逻辑来实现指令系统对于复杂指令，也用微程序技术实现。第三章存储系统：（或存储体系、存储层次）定义：两个或两个以上速度、容量和价格各不相同的存储器用硬件、软件、或软件与硬件相结合的方法连接起来成为一个系统。这个系统对应用程序员透明，并且，从应用程序员看，它是一个存储器，这个存储器的速度接近速度最快的那个存储器，存储容量与容量最大的那个存储器相等，单位容量的价格接近最便宜的那个存储器。在一般计算机系统中，主要有两种存储系统：(1)

11、 Cache存储系统：由Cache和主存储器构成主要目的：提高存储器速度(2) 虚拟存储系统：由主存储器和磁盘存储器构成主要目的：扩大存储器容量磁盘存储器主存储器存储器访问的局部性原理实质：根据程序运行的最近情况，可以较为精确的预测出最近的将来将要访问哪些指令和数据。(1)时间局部性：最近访问过的代码在很短的时间内有可能被再次访问；主要对应于循环语句；（2）空间局部性：与刚被访问过的指令或数据相邻的指令或数据有可能马上被访问；主要对应于顺序执行的语句。访问的局部性原理是构成层次化存储系统的理论基础。存储器的主要性能指标：速度、容量和价格存储容量的单位价格公式：当S2S1时，CC2。因此，整

12、个存储系统的单位容量价格C接近于比较便宜的M2存储器的单位容量价格C2。但是S2于S1不能相差太大，否则，存储系统要达到比较高的性能，调度起来很困难。存储系统的容量要求：存储系统的容量等于M2存储器的容量提供尽可能大的地址空间，且能够随机访问方法有两种： 1、只对M2存储器进行编址，M1存储器只在内部编址2、另外设计一个容量很大的逻辑地址空间存储系统的速度速度用存储器的读出时间、访问周期、频带宽度等表示。读出时间：“读”命令有效到数据总线数据有效的时间间隔TA；访问周期：单体存储器连续两次读写操作的最小时间间隔TM；TMTA命中率H=N1/(N1+N2) N1和N2分别代表对M1存储器和

13、M2存储器的访问次数访问周期T=H*T1+(1-H)*T2 ，当命中率H很大时，访问周期T接近于速度比较快的M1存储器的访问周期T1存储器的访问效率为e=T1/T=1/H+(1-H)*T2/T1所以访问效率主要与H和T2/T1值有关。H 越大越好，T2/T1越小越好，可这个值通常在105很难变小，所以主要通过提高命中率来提高访问效率例：假设T2T，在命中率H 为0.9和0.99两种情况下，分别计算存储系统的访问效率。解：当H0.9时，e1 1(0.95(10.9)0.72当H0.99 时， e21(0.995(10.99)0.96采用预取技术可以大幅度提高命中率。方法是：当不命中时，在数据从

14、主存储器中取出送往CPU的同时，把主存储器相邻几个单元中的数据（称为一个数据块）都取出来送入CACHE。H=(H+N-1)/N ，其中N为CACHE的块大小与数据块重复使用次数的乘积，H是原来的命中率，H 是采用预取技术之后的命中率例：在一个虚拟存储系统中，T2105 T，原来的命中率只有 0.8，现采用预取技术，访问磁盘存储器的数据块大小为4K字，如果要求访问效率不低于 0.9，计算数据在主存储器中的重复利用率至少为多少？解：假设数据在主存储器中的重复利用率为m，根据前面的给出关系：解这个方程组，得到m44，即数据在主存储器中的重复利用率至少为 44次。例：Cache存储系统中，Cache的

15、访问周期为10ns，主存储器的访问周期为60ns,每个数据在Cache中平均重复使用4次。块的大小为1个字时，存储系统的访问效率只有0.5，现在要提高增加块的大小，使存储系统的访问效率达到0.94。1、当存储系统的访问效率为0.5时，计算命中率和等效访问周期；2、为了使存储系统的访问效率达到0.94，命中率和等效访问周期应当为多少？3、为了使存储系统的访问效率从0.5提高到0.94，块的大小至少要增加到几个字？存储器的频带平衡：计算机系统中各级存储器的频带应该达到平衡解决存储器频带平衡方法(1) 多个存储器并行工作（本节）并行访问存储器交叉访问存储器高位交叉访问存储器。主要目的：扩大存储器容

16、量实现方法：用地址码的高位部分区分存储体号低位交叉访问存储器。主要目的：提高存储器访问速度实现方法：用地址码的低位部分区分存储体号低位交叉比高位交叉更常用无访问冲突并行存储器(2) 设置各种缓冲存储器（第五章）(3) 采用存储系统（本章下两节）影响主存命中率的主要因素：(1) 程序在执行过程中的页地址流分布情况。(2) 所采用的页面替换算法。(3) 页面大小。(4) 主存储器的容量(5) 所采用的页面调度方法。堆栈型替换算法的定义：（*课后题*）对任意一个程序的页地址流作两次主存页面数分配，分别分配m个主存页面和n个主存页面，并且有mn。如果在任何时刻t，主存页面数集合Bt都满足关系： Bt（m） Bt（n）则这类算法称为堆栈型替换算法。堆栈型算法的基本特点是：随着分配给程序的主存页面数增加，主存的命中率也提高，至少不会

展开阅读全文

计算机系统结构期末复习

最新文档