5 指令系统 流水线技术(1)_v1.0

上传人:豆浆 文档编号:36328893 上传时间:2018-03-27 格式:PDF 页数:37 大小:479.66KB
返回 下载 相关 举报
5 指令系统 流水线技术(1)_v1.0_第1页
第1页 / 共37页
5 指令系统 流水线技术(1)_v1.0_第2页
第2页 / 共37页
5 指令系统 流水线技术(1)_v1.0_第3页
第3页 / 共37页
5 指令系统 流水线技术(1)_v1.0_第4页
第4页 / 共37页
5 指令系统 流水线技术(1)_v1.0_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《5 指令系统 流水线技术(1)_v1.0》由会员分享,可在线阅读,更多相关《5 指令系统 流水线技术(1)_v1.0(37页珍藏版)》请在金锄头文库上搜索。

1、1北京信息科技大学计算机系统结构5 指令系统(2) 流水线技术(1)张伟 计算机学院计算机系统结构北京信息科技大学大纲回顾上节内容1 现有指令系统2 流水线基本概念3 流水线分类4 经典的5段流水线5 流水线性能分析计算机系统结构北京信息科技大学计算机系统定量设计原理1. 大概率事件优先原则(哈夫曼压缩原理) 加快经常性事件的速度(make the common case fast) 2. 阿姆达尔(Amdahl)定律 定义系统性能的加速比,确定对性能限制最大 的部件,计算改进某些部件所获得的性能提高 3. 程序的局部性原理 空间局部性 时间局部性计算机系统结构北京信息科技大学加速比2改进前S

2、eFeFe+11部件加速比可改进比例(1可改进比例)1总执行时间总执行时间系统加速比部件加速比可改进比例(1可改进比例)1总执行时间总执行时间系统加速比改进后改进前改进后改进前改进后改进后未改进比例:未改进比例:1Fe改进比例:改进比例:FeFe/Se未改进部分未改进部分未改进比例:未改进比例:1Fe计算机系统结构北京信息科技大学指令的组成一般的指令主要由两部分组成:操作码和地址码地址码通常包括三部分内容:地址:地址码、立即数、寄存器、变址寄存器地址的附加信息:偏移量、块长度、跳距寻址方式:直接寻址、间接寻址、立即数寻址、变 址寻址、相对寻址、寄存器寻址计算机系统结构北京信息科技大学指令系统设

3、计基本指令系统通用计算机必须有5类基本指令1. 数据传送类指令2. 运算类指令3. 程序控制指令4. 输入输出指令5. 处理机控制和调试指令指令系统设计要求完整性、规整性、高效率和兼容性计算机系统结构北京信息科技大学现有指令系统CISC复杂指令集(300500)Complex Instruction Set ComputerIntel、 AMD、VIA x86系列(IA-32、 X86-64)RISC精简指令集Reduced Instruction Set Computing中高档服务器中,PowerPC处理器、SPARC处理 器、PA-RISC处理器、MIPS处理器、Alpha处理器 、AR

4、MVLIW超长指令字Very Long Instruction WordEPIC(Explicitly Parallel Instruction Computers)IA-64(安腾Itanium)、crusoe计算机系统结构北京信息科技大学RISC1979年,美国加洲伯克利分校David Patterson 正式提出:RISC1975年,IBM公司率先组织力量开始研究指 令系统的合理性问题1979年研制出世界上第一台采用RISC思想的 计算机IBM 8011986年,IBM正式推出采用RISC体系结构的 工作站IBM RT PC计算机系统结构北京信息科技大学1 二八法则1897年,意大利经济

5、学家帕累托(1848 1923)偶然注意到英国人的财富和收益模式, 于是潜心研究这一模式,并于后来提出了著名 的二八法则。一般情况下,我们付出的80的努力,也就 是绝大部分的努力,都没有创造收益和效果, 或者是没有直接创造收益和效果。而我们80 的收获却仅仅来源于20的努力,其他80的 付出只带来20的成果。计算机系统结构北京信息科技大学为公司创造80收益的客户实际上只占所有客 户的20;而在企业中,20的员工为企业创 造了80的收益。80的交通事故是被那些20的违规驾驶者 造成的;家里的地毯有20遭受了80程度的 磨损;你所有衣服中的20占据了你全部生活 时间的80;你的电脑80的故障是由2

6、0 的原因导致的;你一生使用的80的文句是用 字典里20的字组成的。同样的道理,你20 的朋友,占据了你80与朋友见面的时间计算机系统结构北京信息科技大学在CISC中,大约20的指令占据了80的处 理机执行时间。例如:8088处理机的指令种类大约100种前11种(11)指令的使用频度已经超过80前8种(8)指令的运行时间已经超过80前20种(20)指令:使用频度达到91.1,运行时 间达到97.72其余80的指令:使用频度只有8.9,2.28的 处理机运行时间Intel 80X86最常用的十条指令计算机系统结构北京信息科技大学RISC的定义与特点的定义与特点卡内基梅隆(Carnegie Mel

7、lon)大学论述RISC 的特点如下:(1)大多数指令在单周期内完成(2)LOAD/STORE结构(3)硬布线控制逻辑(4)减少指令和寻址方式的种类(5)固定的指令格式(6)注重编译的优化计算机系统结构北京信息科技大学RISC思想的精华思想的精华减少CPI是RISC思想的精华程序执行时间的计算公式:CPU时间IC * CPI *其中: CPU时间是执行这个程序所使用的总的时间;IC是这个程序所需执行的总的指令条数;CPI(Cycles Per Instruction)是每条指令执行的平均 周期数是一个周期的时间长度。计算机系统结构北京信息科技大学同类问题的程序长度,RISC比CISC长30%4

8、0% CPI,RISC比CISC少2倍10倍 RISC的速度要比CISC快3倍左右,关键是RISC的CPI减小了计算机系统结构北京信息科技大学RISC设计思想也可以用于设计思想也可以用于CISC中中x86处理机的CPI在不断缩小,8088的CPI大于20,80286的CPI大约是5.5,80386的CPI进一步减小到4左右,80486的CPI已经接近2,Pentium处理机的CPI已经与RISC十分接近。目前,超标量处理机、超流水线处理机的CPI已经 达到0.5,实际上用IPC(Instruction Per Cycle)更确切。计算机系统结构北京信息科技大学超长指令字超长指令字VLIWVLI

9、W (Very Long Instruction Word)的背景的背景由美国J. A. Fisher教授于1981年首先提出,最初来 源于水平微程序由J. A. Fisher创建的Mutiflow公司研制了的世界上 第一台VLIW处理机TRACE28/300。一条指令中包含有多个能够同时执行的操作, TRACE28/300处理机的一条超长指令中最多有28 条可以同时执行的指令。算法和编译技术是关键在下一代处理机中将普遍采用计算机系统结构北京信息科技大学流水线基本概念流水线基本概念计算机系统结构北京信息科技大学洗衣店的例子A, B, C, D 均有一些衣物要均有一些衣物要清洗,甩干,折叠清洗,

10、甩干,折叠清洗要花30 分钟甩干要用40 分钟叠衣物也需要20 分钟四人衣物一共要花 4*(30+40+20)=360分钟计算机系统结构北京信息科技大学流水线的基本概念ABCD6 PM789T a s kO r d e rTime30 40404040 20四人衣物一共要花 30+40*4+20=210分钟计算机系统结构北京信息科技大学流水线的基本概念流水线技术:把一个重复的过程分解为若干个 子过程,每个子程序可以与其他子过程同时进 行描述流水线的工作,最常用的方法是时间-空 间图(时空图)横坐标:表示时间,即各个任务在流水线中所经过 的时间纵坐标:表示空间,即流水线的各个子过程,也称 为级、

11、段、流水线深度(Stage)计算机系统结构北京信息科技大学流水线的时空图计算机系统结构北京信息科技大学流水线的特点流水线实际上是把一个功能部件分解成多个独立的子 功能部件(一个任务也就分成了几个子任务,每个子 任务由一个子功能部件完成),并依靠多个子功能部 件并行工作来缩短所有任务的执行时间流水线有助于提高整个程序(所有任务)的吞吐率, 但并没有减少每个指令(任务)的执行时间流水线各个功能段所需时间应尽量相等。否则,时间 长的功能段将成为流水线的“瓶颈”,会造成流水线 的“阻塞”(Stall)流水线开始需要“通过时间”(Fill)和最后需要“排空 时间”(Drain)。流水线只有处理连续不断的

12、任务才能 发挥其效率计算机系统结构北京信息科技大学流水线分类流水线分类计算机系统结构北京信息科技大学流水线的分类(1)按流水线所完成的功能分类单功能流水线:只能完成一种固定功能的流水线多功能流水线:流水线的各段可以进行不同的连接,使流水线在不同的时间,或者在同一时间完成不同的功能例如: TI ASC的多功能流水线计算机系统结构北京信息科技大学流水线的分类(2)按流水线在同一时间内各段的连接方式分类静态流水线:在同一时间内,多功能流水线各段只能按同一种功能连 接。只有当按这种方式工作的所有任务都流出流水线之 后,才能重新连接以实现其他功能。在静态流水线中,只有当输入是一串相同的运算操作时 ,流水

13、的效率才能得到发挥。动画演示动态流水线:在同一时间内,多功能流水线各段可以按不同方式连接 ,同时执行多种功能动画演示计算机系统结构北京信息科技大学动态流水线VS静态流水线优点:能提高流水线的效率缺点:会使流水线的控制变得复杂计算机系统结构北京信息科技大学流水线的分类(3)按照流水线的级别来分部件级流水线(运算操作流水线):把处理机的算术逻辑部件分段,使得各种数据类 型的操作能够进行流水。处理机级流水线(指令流水线):把指令的解释执行过程按照流水方式进行处理。处理机间流水线(宏流水线):它是指由两个以上的处理机串行地对同一数据流 进行处理,每个处理机完成一项任务。动画解析计算机系统结构北京信息科

14、技大学流水线的分类(4)按流水线是否有反馈回路分类线性流水线:流水线的各段逐个串接,输入数据从流水线一端输入从另一端输出;每个段都只流过一次。非线性流水线:流水线的各段除有串接外,还有反馈回路;在一次流水过程中,有的段要被多次使用。(举例)计算机系统结构北京信息科技大学流水线的分类(5)按照数据表示来分标量处理机:不具有向量指令和向量数据表示,仅对标量进 行流水处理的处理机。例如:IBM360/91, Amdahl 470V/6 等向量处理机:具有向量指令和向量数据表示的处理机。例如:TI ASC, CRAY-I 等计算机系统结构北京信息科技大学流水线的分类(6)按照流动是否可以乱序来分顺序流

15、动流水线:流水线输出端任务流出的顺序与输入端任务流 入的顺序相同。异步流动流水线(乱序流水线):流水线输出端任务流出的顺序与输入端任务流 入的顺序不同。计算机系统结构北京信息科技大学流水线举例:流水线举例:DLX / MIPS计算机系统结构北京信息科技大学DLXDLX DLX 是一种简单的指令集(教学、简单芯片)是一种简单的指令集(教学、简单芯片)在不流水的情况下,如何实现在不流水的情况下,如何实现DLXDLX。实现DLX指令的一种简单数据通路计算机系统结构北京信息科技大学计算机系统结构北京信息科技大学MIPS的基本流水线MIPS指令集结构用5个功能段实现,每个功 能段用一个时钟周期1.取指令周期IF(Instruction Fetch)2.指令译码/读寄存器周期ID(Instruction Decode)3.执行/地址计算周期EX(Execute)存储器访问(计算有效地址)寄存器寄存器ALU操作寄存器立即数ALU操作4.存储器访问周期MEM(Memory Access)5.写回周期WB(Write Back)计算机系统结构北京信息科技大学MIPS的简单实现Memory AccessWrite BackInstruction FetchInstr. Decode Reg. FetchExecute Addr. CalcL M DALUMUXMe

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号