《计算机系统结构》电子教案(清华2版)

上传人:飞*** 文档编号:46208876 上传时间:2018-06-23 格式:PPT 页数:182 大小:1.08MB
返回 下载 相关 举报
《计算机系统结构》电子教案(清华2版)_第1页
第1页 / 共182页
《计算机系统结构》电子教案(清华2版)_第2页
第2页 / 共182页
《计算机系统结构》电子教案(清华2版)_第3页
第3页 / 共182页
《计算机系统结构》电子教案(清华2版)_第4页
第4页 / 共182页
《计算机系统结构》电子教案(清华2版)_第5页
第5页 / 共182页
点击查看更多>>
资源描述

《《计算机系统结构》电子教案(清华2版)》由会员分享,可在线阅读,更多相关《《计算机系统结构》电子教案(清华2版)(182页珍藏版)》请在金锄头文库上搜索。

1、计算机系统结构计算机系统结构主讲:华中科技大学计算机学院林安主讲:华中科技大学计算机学院林安2001.9.11计算机系统结构教学计划 教材: 计算机系统结构(第二版) 郑纬民等 清华大学出版社 参考书: 计算机系统结构 复习与考试指导 郑纬民等 高等教育出版社总学时:40 第1章:4 第2章:4 第3章:10 第4章:4 第5章:6 第6章:2 第7章:6 第8章:2 第9、10章:22001.9.12计算机系统结构第一章 基本概念(P1)本章介绍计算机系统结构的一些基本知识。包括定性知识和定量知 识两大组内容。为了便于学习,本章各节重新编号,与教材编号不同。定性知识:本课程经常使用的一些名词

2、概念,以及对计算机的定性 认识、分析方法。定量知识:对计算机性能进行定量评价的几个重要公式。2001.9.13计算机系统结构1.1 定性知识几个基本概念1.1.1 什么是计算机系统结构?(P4)英文名称:Computer Architectrue计算机系统结构(也叫“计算机体系结构”)课程:传授计算机整机( 硬软件统一条件下)设计的重大技术知识。Architectrue的英文原义是“建筑学”。“计算机系统结构”作为事物名称:使用者必须了解的机器外部特性知 识(广义定义)。在本课程中“使用者”目前特指最低级语言的程序员,“外 部特性”特指整个硬件的外部特性(狭义定义)。透明性概念:使用者可以不了

3、解的知识。2001.9.14计算机系统结构“计算机系统结构”狭义定义包含的内容(P4)1.数据表示(硬件能够直接识别和处理的数据类型和格式等);2.寻址方式(包括最小寻址单位、寻址方式的种类、表示和地址计算等);3.寄存器组织(包括各种寄存器的配置数目和功能定义);4.指令系统(包括机器指令的操作类型和格式、指令间的排序方式和控制机构等) ;5.存储系统(包括编址方式、存储容量、最大编址空间等);6.中断机构(中断源的分类管理和中断服务功能设计);7.机器工作状态(如管态、目态等)的定义和切换;8.输入/输出子系统结构与管理;9.信息保护手段及其实现。2001.9.15计算机系统结构1.1.2

4、 计算机系统的多级层次模型(P3)第5级 专用应用语言机器 特定应用用户 (使用特定应用语言)(经应用程序翻译成高级语言) 第4级 通用高级语言机器 高级语言程序员(使用通用高级语言)(经编译程序翻译成汇编语言) 第3级 汇编语言机器 汇编语言程序员(使用汇编语言)(经汇编程序翻译成机器语言、操作系统原语) 第2级 操作系统语言机器 操作系统用户 (使用操作系统原语)(经原语解释子程序翻译成机器语言) 第1级 传统机器语言机器 传统机器程序员(使用二进制机器语言)(由微程序解释成微指令序列) 第0级 微指令语言机器 微指令程序员 (使用微指令语言)(由硬件译码器解释成控制信号序列)图1.1 计

5、算机系统的多级层次模型2001.9.16计算机系统结构1.1.3 其他重要名词概念(自学)计算机组成计算机系统结构的逻辑实现。(P5) 计算机实现计算机组成的物理实现。 (P5)计算机系统设计的3种主要方法:“由下往上”、“由上往下”、“由中 间开始”。(P14)系列机 (P23) 兼容性 (P24)模拟 (P24) 仿真 (P24)虚拟机 (P24) 宿主机 (P24)并行性 求解一个问题的若干操作在时间安排上的可重叠性。2001.9.17计算机系统结构1.1.4 冯.诺依曼(Von Neumann)型机器的特点(P22)传统计算机又称为冯.诺依曼型机器,它由运算器、控制器、存储器、输 入设

6、备和输出设备5部分组成,并具有如下特点:1.以运算器为数据流动中枢,以控制器为控制命令中枢;2.存储程序并且执行,程序象数据一样可以修改;3.存储器按地址访问,线性顺序编址;4.程序顺序执行;5.指令由操作码与操作数两部分组成;6.数据用二进制编码;7.机器由硬件与软件组成,硬件功能不能改变。2001.9.18计算机系统结构1.1.5 现代计算机系统的分类(Flynn分类法,P6)按照指令流和数据流的多倍性状况把计算机分为:1.单指令流单数据流(SISD-Single Instruction Stream Single Data Stream)2.单指令流多数据流(SIMD-Single In

7、struction Stream Multiple Data Stream)3.多指令流单数据流(MISD-Multiple Instruction Stream Single Data Stream)4.多指令流多数据流(MIMD-Multiple Instruction Stream Multiple Data Stream)例题:P32,题7,题8 ,题9 。2001.9.19计算机系统结构1.2 定量知识3个性能公式1.2.1 Amdahl定律(加快经常性事件原理,P9)其中:Sn 全局加速比;To 原执行时间(old);Tn 新执行时间(new);Se 被改进部分的局部加速比;Fe

8、被改进部分原执行时间占原来总时间的百分比。2001.9.110计算机系统结构Amdahl定律的推导2001.9.111计算机系统结构Amdahl定律的图形从图1.2可以看出,增大Se和Fe对Sn都有提升作用;但当Fe固定时 ,一味增大Se对Sn的作用会越来越不显著。2001.9.112计算机系统结构1.2.2 CPI与程序执行时间Te(P11)CPI是衡量CPU执行指令效率的重要指标。让我们先考虑一个标准测 速程序的全部执行时间Te和其中所有第i种指令的累计时间Ti,易知2001.9.113计算机系统结构1.2.3 每秒百万指令数MIPS与每秒百万浮点数MFLOPS( P11)例题:P10,例

9、1.1例1.5。P33,题12 ,题13 ,题14 。2001.9.114计算机系统结构例题选讲(1)例1.1(P10) Amdahl定律公式,已知:Fe=0.4,Se=10,求Sn。 它说明局部(40%)的大幅度改进(10倍)对全局的作用要 小得多(1.56倍)。例1.2(P10) Amdahl定律公式,已知方案1 :Fe1=0.2,Se1=10, 求Sn1;已知方案2 :Fe2=0.5,Se2=2,求Sn2 。 它说明大范围的小幅度改进(方案2)效果可能更好。2001.9.115计算机系统结构例题选讲(2)例1.3(P11) CPI公式,注意该公式中的指令数百分比不同于 Amdahl定律中

10、的时间百分比Fe,避免用错。 已知: ICFP / IC = 25%,IC非FP / IC = 75%;IC FPSQR / IC = 2%,IC非FPSQR / IC = 98%。 改进前:CPI FP = 4.0,CPI非FP = 1.33;CPI FPSQR = 20,CPI非FPSQR = ? 改进后:CPI FP = 2.0, CPI非FP = 老值;CPI FPSQR = 2.0,CPI非FPSQR = 老值。 求: 两种方案改进后的CPI。 分析: 方案2缺一个条件CPI非FPSQR ,但改进前用两种方法 算出 的CPI应该是相同的,所以由CPI 老 = CPI FP ICFP

11、/ IC+ CPI非FP IC非FP / IC= CPI FPSQR ICFPSQR / IC+ CPI非FPSQR IC非FPSQR / IC2001.9.116计算机系统结构例题选讲(3)解出CPI非FPSQR = 80 / 49现在分别用两种方案改进后的参数代入公式,算出新的 CPI为1.64和1.5,显然CPI值较小的方案2较好。教材的解法中有两个小公式值得注意,一个是:另一个公式较容易理解:2001.9.117计算机系统结构例题选讲(4)例1.4(P12) Te公式,其中CPI用相应的公式代换对A机器,已知CPI转=2,IC转/ICA=20%,CPI非转=1,IC非转/ICA=80%

12、 ,Te_A=1.2ICA CYCLEA; 对B机器,从题义可知, IC比转= IC转, ICB = ICA 80% , CYCLEB =1.25 CYCLEA,CPI比转=2,所以IC比转/ICB= IC转/(ICA 80% ) =25% ,CPI非比转=1,IC非比转/ICB=75%, Te_B = 1.25ICB CYCLEB = 1.2580%ICA1.25CYCLEA= 1.25ICACYCLEA Te_A 显然A机器快一些。2001.9.118计算机系统结构例题选讲(5)例1.5(P12) Te公式,改动上题中CYCLEB =1.1 CYCLEA,则最 后 Te_B = 1.25I

13、CB CYCLEB = 1.2580%ICA1.1CYCLEA= 1.1ICACYCLEA ci+1。2001.9.148计算机系统结构3.2.2 性能指标(P132-P134)(1) 容量:S=S2 (理论上)(2) 单价:(美分/bit)2001.9.149计算机系统结构(3) 速度:表现访问速度的参数很多 命中率:反映被访问数据事先已在M1的发生概率 等效访问时间:命中时的访问时间为T1,不命中时的访问时间为T2,等效 访问时间则是它们的概率均值2001.9.150计算机系统结构 访问效率:这是一个相对值,便于不同系统之间的比较。访问效率e受H和r的影响(参见右图) :2001.9.15

14、1计算机系统结构 Cache预取技术对命中率的提高作用(P134):这里所说的“预取”技术,并不是根据对程序执行的未来趋势进行 猜测以提前调入数据,而仅仅是在发生不命中情况时把调入1个数据 字改为调入1个数据块的策略。根据程序的局部化原理,在当前使用 数据周围的其它数据未来被使用的几率大于远处数据,所以该数据块 中被提前调入的邻近数据很可能成为未来的命中点,从而提高命中率 。采用这种预取技术后新的命中率为其中:H 原命中率(即按照不命中时取入1字的策略);H 新命中率(即按照不命中时取入1块的策略);n 每块数据平均被访问次数。2001.9.152计算机系统结构按照定义,原不命中率 ,新不命中

15、率,并且有 。由于预取使得每块数据中的不命中次数由n次降低到1次,所以有。此式可改写为 ,整理得 。H的推导:2001.9.153计算机系统结构 加速比(P193)Cache-主存层次的主要作用是提高访问速度,系统的等效速度应 高于主存(即M2)的原有速度,两个速度之比称为加速比。2001.9.154计算机系统结构M1 103B T1=1us 103BM2 106B TB2=10usM3 109B TB3=100us 109B(a) (b) 例3.2有一个109字节的程序被装 入右图所示的M3准备运行。 假定指令字长=1字节,程序 中无转移指令和内存读/写指 令。(1)按图(a)求T和e; 增加中间层对e的影响(2)按图(b)推导三层体系的T公式;(3)按图(b)求T和e;(4)比较(1)(3)结果,有何结论?2001.9.155计算机系统结构解:2001.9.156计算机系统结构习题: P202,题3。2001.9.157计算机系统结构存储层

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 其它考试类文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号