计算机系统结构复习提纲-(最新版)

上传人:黯然****空 文档编号:144832108 上传时间:2020-09-14 格式:PDF 页数:14 大小:1.04MB
返回 下载 相关 举报
计算机系统结构复习提纲-(最新版)_第1页
第1页 / 共14页
亲,该文档总共14页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《计算机系统结构复习提纲-(最新版)》由会员分享,可在线阅读,更多相关《计算机系统结构复习提纲-(最新版)(14页珍藏版)》请在金锄头文库上搜索。

1、 1 / 14 第 1 章 1.1.1 简要理解什么是图灵机和通用图灵机 图灵机:模拟人们用纸笔进行数学运算的过程 的假想的机器 通用图灵机:能够模拟其它所有图灵机的图灵机 1.1.2 从计算机语言的角度看,计算机系统的多级层次结构是怎样的 第 6 级:应用语言机器 第 5 级:高级语言机器 第 4 级:汇编语言机器 第 3 级:操作系统机器 第 2 级:传统机器语言机器 第 1 级:微程序机器 1.1.3 翻译与解释的区别 翻译:先把高一级机器上的程序全部转换为低一级机器上等效的目标程序,然后再在这低一级机器上运行。执 行过程中,高一级机器上的程序不再被访问。 解释:并不产生目标程序,每取高

2、一级机器上的程序中的一条语句,就直接转去执行低一级机器上的一段等效 的指令。高一级机器上的语句被低一级机器逐条直接执行。 一般来说,解释执行比编译执行耗时多,但占用的存储空间要少。 1.1.4 狭义的计算机系统结构的概念,它与计算机组成和实现的区别与联系 计算机系统结构(狭义) :计算机系统中软硬件的交界面,即机器语言程序员所看到的传统机器级的属性。 计算机组成(也称微体系结构) :计算机系统结构的逻辑实现包含物理机器级中的数据流和控制流的组成以及 逻辑设计等。着眼于硬件系统在逻辑上如何组织的,侧重各部件的逻辑功能以及各部件之间的联系。 计算机实现(即硬件实现) :计算机组成的物理实现包括处理

3、机、主存等部件的物理结构,器件的集成度和速 度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。着眼于器件技术(起主导作用) 、 微组装技术。 具有相同系统结构的计算机可以采用不同的计算机组成,同一种计算机组成又可以采用多种不同的计算机实 现。 1.1.5 广义的计算机系统结构指什么 广义的计算机系统结构概念则囊括了以上 体系结构、组成和实现三个方面。 1.1.6 计算机系统结构分类:Flynn 分类法、冯氏分类法、Handler 分类法 Flynn 分法(指令流、数据流) : 单指令流单数据流 SISD 传统的顺序处理计算机 (Single Instruction str

4、eam Single Data stream) 单指令流多数据流 SIMD 阵列机、向量机、GPU (Single Instruction stream Multiple Data stream) 多指令流单数据流 MISD 无实际机器 (Multiple Instruction stream Single Data stream) 多指令流多数据流 MIMD 多处理机 (Multiple Instruction stream Multiple Data stream) 冯氏分法(字位) : 字串位串:n1,m1。一次处理单个字的一个位(第一代计算机发展初期的纯串行计算机) 字串位并:n1,m

5、1。同时处理单个字的多个位,如 16 位、32 位等。 传统的单处理机,SISD 字并位串:n1,m1。同时处理多个字的同一位(位片) 。某些 SIMD 字并位并:n1,m1。同时处理多个字的多个位。某些 SIMD 和 MIMD 2 / 14 Handler 分类法: 根据并行度和流水线程度对计算机进行分类 把计算机的硬件结构分成 3 个层次: 程序控制部件( PCU)的个数 k 算术逻辑部件( ALU)或处理部件( PE)的个数 d 每个算术逻辑部件包含基本逻辑线路(ELC)的套数 w 1.2.1 计算机系统设计的 5 大(定量)原理是哪 5 个 经常、A/C、局部、并行 1.2.2 Amd

6、ahl 定律 例题 例 1.1,1.2 1.2.3 CPI 公式 例题 例 1.3 例 1.3 假设 FP 指令的比例为 25%, 其中, FPSQR 占全部指令的比例为 2%FP 操作的 CPI 为 4FPSQR 操作的 CPI 为 20, 其他指令的平均 CPI 为 1.33。现有两种改进方案,第一种是把 FPSQR 操作的 CPI 减至 2,第二种是把所有的 FP 操 作的 CPI 减至 2,试比较两种方案对系统性能的提高程度。 解 没有改进之前,每条指令的平均时钟周期 CPI 为: 2%7533. 1%254 1 n i i i IC IC CPICPI 3 / 14 (1)采用第一种

7、方案 FPSQR 操作的 CPI 由 CPIFPSQR20 减至 CPIFPSQR2,则整个系统的指令平均时钟周期数为: CPI1CPI-(CPIFPSQR-CPIFPSQR)2% 2-(20-2)2%1.64 (2)采用第二种方案 所有 FP 操作的 CPI 由 CPIFP4 减至 CPIFP2,则整个系统的指令平均时钟周期数为: CPI2CPI-(CPIFP-CPIFP)25% 2-(4-2)25%1.5 从降低整个系统的指令平均时钟周期数的程度来看,第二种方案优于第一种方案。 1.2.4 计算机系统设计有哪 3 种主要方法(top-down,bottom-up,middle-out) ,

8、每种方法的适用领域 top-down: 首先确定面对使用者的那级机器的基本特征、数据类型和格式、基本命令等 然后再逐级往下设计,每级都考虑如何优化上一级的实现 适用于专用机的设计 bottom-up: 从层次结构的最下面一级开始,逐层往上设计各层的机器 采用这种方法时,软件技术完全处于被动状态,这会造成软件和硬件的脱节,使整个系统的效率降低 在早期被采用得比较多,现在已经很少被采用了 “由上往下”和“由下往上”设计方法的主要缺点软、硬件设计分离和脱节 解决方法:综合考虑软、硬件的分工,从中间开始 middle-out: 首先要进行软、硬件功能分配,确定好这个界面 然后从这个界面开始,软件设计者

9、开始往上设计操作系统、汇编、编译系统等,硬件设计者开始往下设计传统 机器级、微程序机器级等 适用于通用机的设计 1.3.1 程序执行的 CPU 时间计算 CPU 时间=用户时间+系统时间 1.3.2 会用加权算数平均时间、加权几何平均值对机器性能进行比较 第一章 PPT 59 屏 性能比较 1.3.3 常用的基准测试程序有哪些,其中最流行的合成测试程序有哪两种 核心测试程序:从真实程序中选出的关键代码段构成的小程序 小测试程序:简单的只有几十行的小程序 合成的测试程序:人工合成出来的程序 Whetstone 与 Dhrystone 是最流行的合成测试程序(前者测浮点运算性能,后者测整数和字符串

10、运算性能) 1.4.1 冯诺依曼结构的理解, 冯诺依曼结构与哈佛结构的比较 冯诺依曼结构就是一种存储程序计算机结构,现在多专指:指令和数据共享存储和传输总线的存储程序计算机 冯诺依曼瓶颈问题:对指令和数据的访问不能同时进行 冯诺依曼结构的主要特点: 由运算器、控制器、存储器、输入和输出设备 5 部分构成; 计算机以运算器为中心; 存储程序原理,且存储器中指令和数据同等对待; 存储器是按地址访问、按顺序线性编址的一维结构,每个单元的位数是固定的; 指令的执行是顺序的 一般是按照指令在存储器中存放的顺序执行 程序的分支由转移指令实现 由指令计数器 PC 指明当前正在执行的指令在存储器中的地址; 4

11、 / 14 指令由操作码和地址码组成; 指令和数据均以二进制编码表示,采用二进制运算 简述:冯诺依曼结构最根本特点是存储程序原理;共享存储,集中控制,顺序执行,二进制 哈佛结构:把指令和数据的存储和传输总线分开 1.4.2 什么是 RISC 和 CISC RISC:精减指令集计算机 CISC:复杂指令集计算机 1.4.3 实现软件可移植性的常用方法,其中模拟和仿真的区别 常用方法:采用系列机、模拟与仿真、统一高级语言 模拟:用软件的方法在一台现有的机器(称为宿主机)上实现另一台机器(称为虚拟机)的指令集 仿真:用一台现有机器(宿主机)上的微程序去解释实现另一台机器(目标机)的指令集 模拟与仿真

12、的主要区别 : 模拟是用机器语言程序解释另一机器的机器指令;仿真是用微程序直接解释另一机器的机器指令; 1.4.4 晶体管的动态功耗取决于哪些因素(会据此做小计算) 正比于 电容负载电压平方开关频率 1.5.1 并行性的概念(同时性和并发性) 并行性:计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。只要在时间上相互重叠,就存在并行性 同时性:两个或两个以上的事件在同一时刻发生 并发性:两个或两个以上的事件在同一时间间隔内发生 1.5.2 并行性的等级划分(分别从处理数据/执行程序/当前流行应用的角度) (1)从处理数据的角度来看,并行性等级从低到高可分为: 字串位串:每次只对一个字的

13、一位进行处理 最基本的串行处理方式,不存在并行性 字串位并:同时对一个字的全部位进行处理,不同字之间是串行的 开始出现并行性 字并位串:同时对许多字的同一位(称为位片)进行处理 具有较高的并行性 全并行:同时对许多字的全部位或部分位进行处理 最高一级的并行 (2)从执行程序的角度来看,并行性等级从低到高可分为: 指令内部并行:单条指令中各微操作之间的并行 指令级并行:并行执行两条或两条以上的指令 线程级并行:并行执行两个或两个以上的线程 通常是以一个进程内派生的多个线程为调度单位。 进程级并行:并行执行两个或两个以上的进程 以进程或子程序为调度单元。 作业级并行:并行执行两个或两个以上的作业或

14、程序 (3)从现在流行的应用的角度,对并行性的一种新划分: 指令级并行:利用流水线思想开发的指令间并行 数据级并行:向量机、GPU 等 SIMD 型处理机将单条指令并行应用于一个数据集(多个数据项) 线程级并行:并行执行多个线程 请求级并行:并行执行多个(请求)任务 1.5.1 提高并行性有哪三种途径 时间重叠:引入时间因素,让多个处理过程在时间上相互错开,轮流重叠地使用同一套硬件设备的各个部分,以加快硬件周转而 赢得速度 资源重复:引入空间因素,以数量取胜。通过重复设置硬件资源,大幅度地提高计算机系统的性能 资源共享:这是一种软件方法,它使多个任务按一定时间顺序轮流使用同一套硬件设备 1.5

15、.2 简要回答并行机的发展的 5 个阶段 并行机的萌芽阶段(1964 年1975 年) 向量机的发展和鼎盛阶段(1976 年1990 年) MPP 出现和蓬勃发展阶段(1990 年1995 年) 各种体系结构并存阶段(1995 年2000 年) 机群蓬勃发展阶段(2000 年以后) 5 / 14 第 2 章: 2.1.1 计算机指令集架构(ISA)有哪三种类型,其中哪种是现代的主流结构。 常见的指令集中 x86/ARM/MIPS/Powe 分 别属于 RM 型还是 RR 型 堆栈结构 累加器结构 通用寄存器结构(现代的主流结构) RM 型:x86 RR 型:ARM、MIPS、PowerPC 2

16、.2.1 信息存储的整数边界对齐原则(结合存储对齐的作业做理解) 信息在主存中存放的起始地址必须是该信息宽度(字节数)的整数倍 2.3.1 简要说明指令系统设计的基本要求有哪 5 点 完整性、规整性、正交性、高效率、兼容性 2.3.2 指令操作码的优化编码方法有哪三种,其中哈夫曼编码是重点,掌握例 2.1 哈夫曼编码、等长扩展码、定长操作码 例 2.1 假设某模型机有 7 条指令,这些指令的使用频度如下表所示。 (1) 计算这 7 条指令的操作码编码的最短平均码长; 17. 2log 7 1 2 i ii ppH (2) 画出哈夫曼树,写出这 7 条指令的哈夫曼编码,并计算该编码的平均码长和信息冗余量。 1 1 1 1 1 1 0 0 0 0 0 I7 I6 I5 I4 I3 I2 I1 1.00 0.60 0.30 0.15 0.06 0.09 0.03 0.03 0.04 0.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > 总结/计划/报告

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号