《第3章1流水》-精选课件(公开PPT)

上传人:zhuma****mei1 文档编号:136013051 上传时间:2020-06-22 格式:PPT 页数:109 大小:2.42MB
返回 下载 相关 举报
《第3章1流水》-精选课件(公开PPT)_第1页
第1页 / 共109页
《第3章1流水》-精选课件(公开PPT)_第2页
第2页 / 共109页
《第3章1流水》-精选课件(公开PPT)_第3页
第3页 / 共109页
《第3章1流水》-精选课件(公开PPT)_第4页
第4页 / 共109页
《第3章1流水》-精选课件(公开PPT)_第5页
第5页 / 共109页
点击查看更多>>
资源描述

《《第3章1流水》-精选课件(公开PPT)》由会员分享,可在线阅读,更多相关《《第3章1流水》-精选课件(公开PPT)(109页珍藏版)》请在金锄头文库上搜索。

1、,第3章 流水技术与流水处理机,难点:单功能非线性流水线的最优调度,重点:线性流水线性能分析; 单功能非线性流水线优化调度,掌握:流水线工作原理;时空图基本方法; 流水线速度瓶颈分析;流水线相关; 向量流水处理机性能分析,理解:流水线基本概念,流水线,引言-必要性,Intel首次在486芯片中采用流水线技术,1989年4月,提高指令执行速度的三种主要途径:,采用RISC技术减少指令执行的平均时间。 特点:专用领域,采用更好的算法和设计更好的功能部件 特点:可扩展,可重用 实例:指令并行技术,使多条指令并行执行。 基本方法:设置多个独立的操作部件空间并行性 分时使用同一个部件的不同部分时间并行性

2、,提高处理机的工作主频。 特点:提升困难,第3章 流水技术与流水处理机,提高处理机的工作主频。 特点:提升困难,引言-实例 实例1 CPU中流水线与超线程 实例2 显卡中流处理器,第3章 流水技术与流水处理机,影驰GTX460 WHDI显卡,Intel Core i7,引言-本章知识结构,第3章 流水技术与流水处理机,目标2:线性流水线性能分析,目标3:单功能非线性流水线优化调度,目标5: 单功能非线性流水线延迟最优调度,目标4: 多功能非线性流水线优化调度,目标6:超线程与流水线关键技术,目标7:多发射处理机及其性能(I7架构分析),目标1:指令重叠与先行控制 流水线性质与分类,基本 概念,

3、算法 分析 + 计算 评测,展望,总 体 目 标 知 其 所 以 然,什么是流水线? 考虑设计一个洗衣机的工作流程,假定它有三道工序:洗涤、清洗、甩干。每个环节为5分钟。 需要完成的任务为3批,则考虑下述工作方式的工作效率: 第一种:串行工作方式,即按照如下方式工作:,3批衣服的整个工作时间为3*3*5=45分钟,第二种:重叠工作方式,设计三个部件,可以同时工作,每个部件只做一样工作,操作方式如下图:,生活中的流水线,3批衣服的工作时间为6*5=30分钟,节省15分钟。,引出下述关于洗衣机工作的有关性能特点: 吞吐率:单位时间内完成的任务数TP=n/T 加速比:串行方式与流水线方式的时间比:上

4、述为 45/30=1.5 效率:即洗衣机的利用率,上述洗衣机的效率是9/15=3/5,将一条指令的执行分为几个阶段,让几条指令按流水线工作。这就引出了计算机中的流水线技术。,先行控制技术是为了实现指令的重叠执行提出的,指令的重叠执行方式能有效的缩短指令执行的平均时间。没有先行控制,指令重叠无法实现。 一、指令的顺序执行方式与重叠执行方式 指令执行的主要工作方式: 顺序 重叠 同时 顺序方式是解释完一条指令再开始解释下一条 重叠方式 一条指令执行完之前,就可开始解释下一条指令 同时方式 多条指令同时开始执行,3.1指令重叠与先行控制,3.1指令重叠与先行控制,一、指令的顺序执行方式与重叠执行方式

5、 1.顺序方式是解释完一条指令再开始解释下一条,。,每阶段时间为t,共n条指令,顺序串行(sequence):,设指令工作方式分成取指令、分析、执行指令,若各阶段执行时间相等,则共需3nt,优点:控制简单; 缺点:速度慢,机器各部件的利用率很低。,取指,执行,分析,3.1指令重叠与先行控制,一、指令的顺序执行方式与重叠执行方式 2. 重叠方式:一次重叠执行方式 如果执行一条指令的三个阶段的时间均相等(t),理想状态下,则执行n条指令所用的时间为: T(12n)t 主要优点:指令的执行时间缩短 功能部件的利用率明显提高 主要缺点:需要增加一些硬件 控制过程稍复杂 动画,3.1指令重叠与先行控制,

6、2. 重叠方式:二次重叠执行方式 如果执行一条指令的三阶段的时间均相等(t),理想状态下,则执行n条指令所用的时间为: T(2n)t 理想情况下,处理机中同时有三条指令在执行 处理机结构要作比较大的改变,需要采用流水线技术和缓存技术 思考题(同时方式) : 两条指令可以同时开始执行,如果执行一条指令的三阶段的时间均相等(t),理想状态下,则执行n条指令所用的时间是多少?它与二次重叠方式有什么主要区别?,3.1指令重叠与先行控制,采用二次重叠执行方式必须解决以下2个问题 1.需要有独立的取指令部件、指令分析部件和指令执行部件。独立的控制器:存储控制器、指令控制器、运算控制器 2.需要解决访问主存

7、的冲突问题:取指令、分析和执行指令都可能要访问存储器 解决方案有3种: 1.采用两个独立编址的存储器组成主存(哈佛结构) 2.主存为并行存储器(若访问同一个存储体则无法重叠) 3.采用先行控制技术(根本办法),指存,数存,主存、cache,3.1指令重叠与先行控制,3.采用先行控制技术 先行控制技术( Advanced Control、Look-Control)技术的关键是缓冲技术和预处理技术,以及这两者的相结合。 采用先行控制技术的处理器结构 (红色部分统称为先行控制器),假设一条指令的执行过程分为“取指令”、“分析”和“执行”三段,每一段的执行时间分别为t、2t和3t。在下列各种情况下,分

8、别写出连续执行n条指令所需要的时间表达式。 (1)顺序执行方式。 (2)仅“取指令”和“执行”重叠。 (3) “取指令”、“分析”和“执行”重叠,习题1,(1)顺序执行需要的时间如下: (2)取指令和执行重叠,即一次重叠执行方式,我们假设第n+1条指令的取指令和第n条指令的执行同时结束,那么所需要的时间为: (3)取指令、分析和执行重叠,解答,一条线性流水线有4个功能段组成,每个功能段的延迟时间都相等,都为t。开始5个任务,每间隔一个t向流水线输入一个任务,然后停顿2个t,如此重复。求流水线的实际吞吐率、加速比和效率。,习题2,习题2,解答 流水线的时空图如下:,我们可以看出,在(11n+1)

9、t的时间内,可以输出5n个结果,如果指令的序列足够长(n),并且指令间不存在相关,那么,吞吐率可以认为满足: 加速比为: 从上面的时空图很容易看出,效率为:,3.1指令重叠与先行控制-小结,思路整理,总体目标,关键问题,解决办法,思考过程,如何分析,对下一节的作用:流水线性能分析时,可把这部分知识看成透明的,3.1指令重叠与先行控制,3.采用先行控制技术 采用先行控制技术的处理器结构 (红色部分统称为先行控制器),点菜员,购物员,送菜员,打下手,*3.1 流水线基本概念与特点,空间并行性: 设置多个独立的操作部件 多操作部件处理机 超标量处理机 时间并行性: 流水线技术 不增加或只增加少量硬件

10、就能使运算速度提高几倍 流水线处理机 超流水线处理机,*3.1 流水线基本概念与特点,引言: 流水处理方式:把一个需要反复进行的过程分离为若干独立的子过程,每个子过程与其它子过程同时处理不同的对象。 优势:不增加或少增加硬件成本就能把指令序列的处理过程提高几倍。 实质:流水方式是利用时间重叠的并行技术来开发计算机相同的并行性。,1.简单流水线 流水线的每一个阶段称为一个流水节拍、流水步、流水步骤、流水阶段、流水线阶段、功能段、流水流水段、流水段、流水级等 在每一个流水段的末尾或开头必须设置一个寄存器,称为流水寄存器、流水锁存器等。会增加指令的执行时间 为了简化,在一般流水线中不画出流水线寄存器

11、,*3.1 流水线基本概念与特点,2.两种指令流水线 一般4-20个流水段 3.流水线时空图,一个浮点加法器流水线时空图,只有连续提供同种任务才能充分发挥流水线的效率。 对于指令流水线:要尽量减少因条件分支造成的“断流” 对于操作部件:主要通过编译技术,尽量提供连续的同类操作 每个流水段都要有一个流水锁存器 增加时间开销:流水线的执行时间加长 增加硬件开销:每段需要增加一个寄存器 各流水线时间应尽量相等 流水线处理机的基本时钟周期等于时间最长的流水段的时间长度 流水线需要有“装入时间”和“排空时间”,*3.1 流水线基本概念与特点,3.2 流水线的分类与性能,一、流水线分类,1按照流水线的级别

12、来分, 部件级流水线(运算操作流水线):部件内各子部件构成的流水线,即把处理机的算术逻辑部件分段,使得各种数据类型的操作能够进行流水。(如:求阶差,对阶,尾数加,规格化), 处理机级流水线(指令流水线):处理机内各部件之间的流水线,把指令的解释执行过程按照流水方式进行处理。 例如:前面把指令解释过程分解为: 分析和执行 DLX的基本流水线把指令解释过程分解为: 取指令、指令译码、执行、访存、写回。,3.2 流水线的分类与性能,一、流水线分类,3.2 流水线的分类与性能,一、流水线分类, 处理机间流水线(宏流水线):它是指由两个 以上的处理机串行地对同一数据流进行处理, 每个处理机完成一项任务。

13、,处理机1,处理机2,处理机n,数据集,图:处理机的流水处理,系统级流水-宏流水,3.2 流水线的分类与性能,一、流水线分类,2. 按照是否有反馈回路来分, 线性流水线:流水线中的各段串行连接,没 有反馈回路。 非线性流水线:流水线中的各段除有串行连接 外,还有反馈回路。 动画,3.2 流水线的分类与性能,一、流水线分类,3.2 流水线的分类与性能,一、流水线分类, 单功能流水线:只能完成一种固定功能的 流水线。 多功能流水线:流水线的各段可以进行不同的 连接,从而实现不同的功能。 例如: TI ASC的多功能流水线,3按功能的多少来分,3.2 流水线的分类与性能,TI ASC的多功能流水线,

14、3.2 流水线的分类与性能,一、流水线分类,在静态流水线中,只有当输入是一串相同 的运算操作时,流水的效率才能得到发挥。 动画,4按同一时间内各段之间的连接方式来分, 静态流水线:在同一时间段,流水线的各段只能 按同一种功能的连接方式工作。,3.2 流水线的分类与性能,一、流水线分类, 动态流水线:在同一时间段,流水线的各段可以 按不同功能的连接方式工作。 这样就不是非得相同运算的一串操作才能 流水处理。 优点:能提高流水线的效率 缺点:会使流水线的控制变得复杂,3.2 流水线的分类与性能,一、流水线分类,5按照数据表示来分, 向量处理机:具有向量指令和向量数据表示的 处理机。 例如:TI A

15、SC, CRAY-I 等, 标量处理机:不具有向量指令和向量数据表示, 仅对标量进行流水处理的处理机。 例如:IBM360/91, Amdahl 470V/6 等,3.2 流水线的分类与性能,二、时空图,时空图从时间和空间两个方面描述了流水 线的工作过程。时空图中,横坐标代表时间, 纵坐标代表流水线的各个段。,3.2 流水线的分类与性能,3.2 流水线的分类与性能,二、时空图,1,2,3,4,t0, t0, t0, t0,T0=m t0,(n-1) t0,填入 正常 排空,流水时空图,空间,时间,3.2 流水线的分类与性能,二、时空图,2、流水线特点: 1)流水一定重叠,比重叠更苛刻。 2)一条流水线通常有多个流水段组成。 3)每段有专用功能部件,各部件顺序连接,不断流。 4)流水线有建立时间、满载时间、排空时间, 5)各段时间尽量短、一致;不一致时最慢子过程为瓶颈。 6)给出指标如最大吞吐率,为满负载最佳指标。,建立时间:在流水线开始时有一段流水线填入时间,使得流水线填满。 正常流动时间:流水线正常工作,各功能段源源不断满载工作。 排空时间:在流水线第一条指令结束时,其他指令还需要一段释放时间。,3.2 流水线的分类与性能,二、时空图,3.2 流水线的分类与性能,二、时空图,静态多功能流水线时-空图,静态流水线:在同

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号