计算机系统结构(第十一讲)课件

上传人:我*** 文档编号:141433803 上传时间:2020-08-08 格式:PPT 页数:33 大小:9.56MB
返回 下载 相关 举报
计算机系统结构(第十一讲)课件_第1页
第1页 / 共33页
计算机系统结构(第十一讲)课件_第2页
第2页 / 共33页
计算机系统结构(第十一讲)课件_第3页
第3页 / 共33页
计算机系统结构(第十一讲)课件_第4页
第4页 / 共33页
计算机系统结构(第十一讲)课件_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《计算机系统结构(第十一讲)课件》由会员分享,可在线阅读,更多相关《计算机系统结构(第十一讲)课件(33页珍藏版)》请在金锄头文库上搜索。

1、Fetch-and-Add指令用于多处理机系统中的进队和出对问题 图7.49:IBM公司的RP3机器 开关网络:由混洗交换网组成的合并网络,选择互连网络必须综合考虑速度和成本两个指标 (1)、总线的成本最低,速度最慢 (2)、交叉开关的成本最高,速度最快 (3)、混洗交换网络的速度和成本都介于总线和交叉开关之间 超立方体网络也是一种速度和成本居于适中位置的网络,如连接机(Connection Machine)、Cosmic Cube系统等,第八章 SIMD计算机,SIMD计算机,亦称并行处理机、阵列处理机(单一控制部件控制下的多个处理单元构成的阵列) 主要内容:SIMD计算机的模型、基本结构、

2、并行算法和具体实例,8.1 SIMD计算机模型,SIMD计算机的抽象模型:在同一个控制部件管理下,有多个处理单元,所以处理单元均收到从控制部件广播来的同一条指令,但操作对象是不同的数据 图8.1:H.J.Siegel提出的SIMD计算机的操作模型 M=(N,C,I,M,R) N:为机器的处理单元(PE)数 C:为由控制部件(CU)直接执行的指令集 I:为由CU广播至所有PE进行并行执行的指令集 M:为屏蔽方案集 R:为数据寻径功能集,MasPar MP-1计算机 表8.1:三种SIMD计算机 细粒度、位片式SIMD计算机 (所谓细粒度并行性,则是指在一个进程中进行指令一级或操作一级的并行处理)

3、,8.2 SIMD计算机的基本结构,8.2.1 分布式存储器结构,图8.2:分布式存储器结构的SIMD计算机 数据寻径网络、阵列控制部件、控制存储器、标量处理机、处理单元(PE)、本地存储器(LM) 通过控制部件的是单指令流,指令的执行顺序和单处理机一样,是串行处理 如果是标量操作或控制操作指令,则直接由与控制部件相连的标量处理机执行;如果是向量操作,则将它广播到所有PE并行地执行 Illiac :由64个PE组成,PE间通过8*8环绕连接网络实现互连 分布式存储器SIMD计算机的主要差别为进行PE之间互相通信的数据寻径网络不同,8.2.2 共享存储器结构,图8.3:共享存储器的SIMD计算机

4、 共享的多体并行存储器SM通过对准网络与各处理单元PE相连 m N BSP(Burroughs Scientific Processor)计算机:见P364 16个PE、17个SM:可以实现无冲突并行地访问存储器,8.2.3 SIMD计算机的特点,向量处理机和SIMD计算机都能对大量数据进行向量处理 SIMD计算机的特点: (1)、与流水线向量处理机一样,特别适于高速数值计算 (2)、与多处理机(MIMD)相比,SIMD计算机具有较固定的结构,它直接与一定的算法相联系,其效率取决于计算程序向量化的程度 (3)、与流水线向量处理机相比,SIMD计算机依靠的并行措施是资源重复,而不是时间重复 (4

5、)、标量运算速度和编译过程的开销,也是影响SIMD系统实际有效速度的另外两个因素 (5)、SIMD计算机基本上是一台向量处理专用计算机,8.3 SIMD计算机实例,图8.4:SIMD计算机的发展过程 Illiac 为最先采用SIMD计算机结构的计算机 一个方向为用位片PE制造的SIMD计算机 另一个方向为以SIMD模式运行的同步MIMD计算机,8.3.1 Illiac 阵列处理机,Illiac 阵列处理机:美国Barnes公司和Illinois大学研制的 图8.5:Illiac 系统总框图 两大部分: (1)、 Illiac 阵列 (2)、 Illiac 输入输出系统 三种类型处理机: (1)

6、、专门对付数组运算的处理单元阵列(processing element array); (2)、阵列控制器(array control unit),它既是处理单元阵列的控制部分,又可以视为一台相对独立的小型标量处理机; (3)、一台标准的Burroughs B6700计算机,担负Illiac 输入输出系统和操作系统管理功能。,1、 Illiac 阵列,Illiac 阵列由64个PE(处理单元)、64个PEM(处理单元存储器)和MLU(存储器逻辑部件)组成 图8.6: Illiac 处理部件的连接 Illiac 的阵列结构又称为闭合螺线阵列 n*n个单元组成的阵列中,任意两个处理单元之间的最短距

7、离不会超过(n-1)步,图8.7: Illiac 处理单元的原理框图 包括:RGA、RGB、RGR、RGS、RGX、RGM、AU、LU、SU、ADA、MAR 操作数来自四个方面:PE本身的寄存器、阵列存储器、CU的公共数据总线(CDB)、PE的四个近邻 MLU:存储器逻辑部件 阵列存储器:64个PEM(处理单元存储器) PE和PEM之间经过MLU相连,2、阵列控制器,阵列控制器(CU)的功能: (1)、对指令流进行控制和译码,包括执行一整套标量操作指令 (2)、向各处理单元发出执行数组操作指令所需的控制信号 (3)、产生和向所有处理单元广播公共的地址部分 (4)、产生和向所有处理单元广播公共的数据 (5)、接收和处理由各PE、系统I/O操作以及B6700所产生的陷阱中断信号,CU与PE阵列之间的信息通道: (1)、CU总线 (2)、CDB(common data bus) (3)、模式位线(mode bit line) (4)、指令控制线,3、输入输出系统,输入/输出系统:磁盘文件系统(DFS)、I/O分系统和B6700组成 磁盘文件系统(DFS):是两套大容量并行读写磁盘系统及其相应的控制器 I/O分系统:输入输出开关(IOS)、控制描述字控制器(CDC)、输入输出缓冲存储器(BIOM) B6700管理计算机:单中央处理器、32K字内存、经过多路开关控制的一大批外围设备,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号