第4章 向量处理机(简化版)

上传人:ldj****22 文档编号:48897513 上传时间:2018-07-21 格式:PPT 页数:23 大小:367.50KB
返回 下载 相关 举报
第4章 向量处理机(简化版)_第1页
第1页 / 共23页
第4章 向量处理机(简化版)_第2页
第2页 / 共23页
第4章 向量处理机(简化版)_第3页
第3页 / 共23页
第4章 向量处理机(简化版)_第4页
第4页 / 共23页
第4章 向量处理机(简化版)_第5页
第5页 / 共23页
点击查看更多>>
资源描述

《第4章 向量处理机(简化版)》由会员分享,可在线阅读,更多相关《第4章 向量处理机(简化版)(23页珍藏版)》请在金锄头文库上搜索。

1、1/72第4章 向量处理机大连海事大学计算机系(该章可以看做是流水线部分的继续)2/724.1向量的处理方式4.2向量处理机的结构4.3提高向量处理机性能的常用技术4.4向量处理机的性能评价 4.5向量处理机实例3/72向量由一组有序、具有相同类型和位数的元素组成。(特别适合流水处理,流水线最适合处理大批量重复且无关联的计算)在流水线处理机中,设置向量数据表示和相应的向量 指令,称为向量处理机。不具有向量数据表示和相应的向量指令的流水线处理 机,称为标量处理机。典型的向量处理机q1976年 Cray-1超级计算机浮点运算速度达到了每秒1亿次qCDC Cyber 205,Cray Y-MP,NE

2、C SX-X/44, Fujitsu VP2600等. 性能达到了每秒几十亿几百亿次浮点 运算4/724.1 向量的处理方式以计算表达式 D=A(BC)为例 A、B、C、D 长度为 N 的向量,习惯以列向量的形式来表示 5/724.1 向量的处理方式w横向(水平)处理方式向量计算是按行的方式从左到右横向地进行。q先计算: d1a1(b1c1)q再计算: d2a2(b2c2)q q最后计算: dNaN(bNcN)组成循环程序进行处理。qibicidiqiaiq数据相关:N次 不适合于向量处理机的并行处理。6/724.1 向量的处理方式w纵向 (垂直)处理方式向量计算是按列的方式从上到下纵向地进行

3、。(将整个向量按相同的运算处理完后,再进行别的运算)q1b1c1 d1q1a1先计算 再计算 qNbNcN dNqNaN表示成向量指令:QBCDQAq两条向量指令之间:数据相关:1次7/724.1 向量的处理方式w纵横 (分组)处理方式又称为分组处理方式。把向量分成若干组,组内按纵向方式处理,依次 处理各组。对于上述的例子,设:N=Snrq其中N为向量长度,S为组数,n为每组的 长度,r为余数。q若余下的r个数也作为一组处理,则共有 S+1组。运算过程为:8/724.1 向量的处理方式9/724.1 向量的处理方式q先算第1组:Q1nB1nC1nD1nQ1nA1nq再算第2组:Q(n+1)2n

4、B(n+1)2nC(n+1)2nD(n+1)2nQ(n+1)2nA(n+1)2nq依次进行下去,直到最后一组:第S+1组。q每组内各用两条向量指令。组内数据相关:1次10/72向量处理机的结构因具体机器不同而不同。由所采用的向量处理方式决定。有两种典型的结构q存储器-存储器型结构纵向处理方式采用q寄存器-寄存器型结构分组处理方式采用4.2 向量处理机的结构11/724.2 向量处理机的结构4.2.1 “存储器-存储器”结构采用纵向处理方式的向量处理机对处理机结构的要求 :存储器存储器结构 对向量长度N没有限制。向量指令的源向量和目的向量都是存放在存储器中,运算的中间结果需要送回存储器。 流水线

5、运算部件的输入和输出端都直接(或经过缓冲器)与存储器相联,从而构成存储器-存储器型操作的运算流水线。 例如:早期的向量机 Star 100、Cyber 20512/724.2 向量处理机的结构w要充分发挥这种结构的流水线效率,存储器要不断地 提供源操作数,并不断地从运算部件接收结果。(每拍从存储器读取两个数据,并向存储器写回一个结果)对存储器的带宽以及存储器与处理部件的通信带 宽提出了非常高的要求。解决方法:一般是通过采用多体交叉并行存储器 和缓冲器技术。 例如,70年代初问世的Star 100q存储器:32个体交叉q每个体的数据宽度:8个字(字长64位)q最大数据流量:每秒2亿字13/724

6、.2 向量处理机的结构在向量的分组处理方式中,对向量长度N没有限 制,但组的长度n却是固定不变的。对处理机结构的要求:寄存器寄存器结构设置能快速访问的向量寄存器,用于存放源向量 、目的向量及中间结果。让运算部件的输入、输 出端都与向量寄存器相联,就构成了“寄存器 寄存器”型操作的运算流水线。q典型的寄存器寄存器结构的向量处理机 美国的CRAY-1、我国的YH-1巨型机4.2.2 “寄存器-寄存器”结构14/72提高向量处理机性能的方法设置多个功能部件,使它们并行工作;采用链接技术,加快一串向量指令的执行;采用循环开采技术,加快循环的处理;采用多处理机系统,进一步提高性能。4.3 提高向量处理机

7、性能的常用技术15/724.3 提高向量处理机性能的常用技术w两条向量指令占用功能流水线和向量寄存器的4种情况 指令不相关例如:V0V1V2V6V4*V5q这两条指令分别使用各自所需的流水线和 向量寄存器,可以并行执行。 功能部件冲突例如:V3V1V2V6V4V54.3.2 链接技术16/724.3 提高向量处理机性能的常用技术q这两条指令都要使用加法流水线,发生了 功能部件冲突(但向量寄存器不冲突)。当第一条指 令流出时,占用加法流水线。第二条指令要等加法流 水线变成空闲后,才能流出。 源寄存器冲突例如:V3V1V2V6V1*V4q这两条向量指令的源向量之一都取自V1 。由于两者的首元素下标

8、可能不同,向量长度也可能 不同,所以难以由V1同时提供两条指令所需要的源 向量。q这两条向量指令不能同时执行。只有等第 一条向量指令执行完、释放V1之后,第二条向量指 令才能开始执行。17/724.3 提高向量处理机性能的常用技术结果寄存器冲突两条向量指令使用了相同的结果向量寄存器。例如:V4V1V2V4V3*V5q这两条指令都要访问目的寄存器V4。由 于第一条指令在先,所以它先占用V4直到运算完成 ,然后再流出后一条指令。w当前一条指令的结果寄存器是后一条指令的源寄存器 、且不存在任何其他冲突时,就可以用链接技术来提 高性能。例如:V3V1V2V6V3*V418/724.3 提高向量处理机性

9、能的常用技术向量流水线链接:具有先写后读相关的两条指令,在不出现功能部件冲突和源向量冲突的情况下,可以把功能部件链接起来进行流水处理,以达到加快执行的目的。qCray-1向量处理的一个显著特点 q链接特性的实质把流水线定向的思想引入到向量执行过程的结果。19/724.3 提高向量处理机性能的常用技术如果向量的长度大于向量寄存器的长度,该如何处理呢? 当向量的长度大于向量寄存器的长度时,必须把 长向量分成长度固定的段,然后循环分段处理, 每一次循环只处理一个向量段。这种技术称为分段开采技术。q由系统硬件和软件控制完成,对程序员是 透明的。 4.3.3 分段开采技术20/72衡量向量处理机性能的主要参数 :向量指令的处理时间向量长度为无穷大时的向量处理机的最大性能半性能向量长度向量长度临界值4.4 向量处理机的性能评价21/724.4 向量处理机的性能评价w向量处理机的最大性能(峰值性能) RR 表示当向量长度为无穷大时,向量处理机的最高性能,也称为峰值性能。22/724.4 向量处理机的性能评价w 半性能向量长度n1/2半性能向量长度n1/2是指向量处理机的性能为其最大性能的一半时所需的向量长度。23/724.4 向量处理机的性能评价3. 向量长度临界值nv向量长度临界值nv是指:对于某一计算任务而言,向量方式的处理速度优于标量串行方式处理速度时所需的最小向量长度。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号