并行计算机系统及结构模型-不再因为别人过得好而焦虑

上传人:tia****nde 文档编号:67698398 上传时间:2019-01-08 格式:PPT 页数:131 大小:3.19MB
返回 下载 相关 举报
并行计算机系统及结构模型-不再因为别人过得好而焦虑_第1页
第1页 / 共131页
并行计算机系统及结构模型-不再因为别人过得好而焦虑_第2页
第2页 / 共131页
并行计算机系统及结构模型-不再因为别人过得好而焦虑_第3页
第3页 / 共131页
并行计算机系统及结构模型-不再因为别人过得好而焦虑_第4页
第4页 / 共131页
并行计算机系统及结构模型-不再因为别人过得好而焦虑_第5页
第5页 / 共131页
点击查看更多>>
资源描述

《并行计算机系统及结构模型-不再因为别人过得好而焦虑》由会员分享,可在线阅读,更多相关《并行计算机系统及结构模型-不再因为别人过得好而焦虑(131页珍藏版)》请在金锄头文库上搜索。

1、并行计算,第一章并行计算机系统及结构模型,1.1 并行计算 1.2 单处理机与指令级并行 1.3 多核处理器与线程级并行 1.4 并行计算机系统结构 1.5 并行计算概述,1.1 并行计算,1.1.1 并行计算与计算科学 1.1.2 当代科学与工程问题的计算需求,并行计算,并行计算:并行机上所作的计算,又称高性能计算或超级计算。 分布式计算:分布式环境下的计算 计算科学 理论科学、实验科学、计算科学 计算科学:计算物理、计算化学、计算生物等 科学与工程问题的需求: 气象预报、油藏模拟、核武器数值模拟、航天器设计、基因测序等。,并行计算,需求类型: 计算密集 数据密集 网络密集。 问题规模,并行

2、计算机,美国HPCC计划:重大挑战性课题,3T性能 美国Petaflops研究项目:Pflop/s。 美国ASCI计划:核武器数值模拟。,第二章 并行计算机系统互连与基本通信操作,2.1 并行计算机互连网络 2.1.1 静态互连网络 2.1.2 动态互连网络 2.1.3 标准互连网络 2.2 选路方法与开关技术 2.3 单一信包一到一传输 2.4 一到多播送 2.5 多到多播送,系统互连,不同带宽与距离的互连技术: 总线、SAN、LAN、MAN、WAN,局部总线、I/O总线、SAN和LAN,静态互连网络 与动态互连网络,静态互连网络 处理单元间有着固定连接的一类网络,在程序执行期间,这种点到点

3、的链接保持不变;典型的静态网络有一维线性阵列、二维网孔、树连接、超立方网络、立方环、洗牌交换网、蝶形网络等 动态网络 用交换开关构成的,可按应用程序的要求动态地改变连接组态;典型的动态网络包括总线、交叉开关和多级互连网络等。,网络性能指标,节点度(Node Degree):射入或射出一个节点的边数。在单向网络中,入射和出射边之和称为节点度。 网络直径(Network Diameter): 网络中任何两个节点之间的最长距离,即最大路径数。 对剖宽度(Bisection Width) :对分网络各半所必须移去的最少边数 对剖带宽( Bisection Bandwidth):每秒钟内,在最小的对剖平

4、面上通过所有连线的最大信息位(或字节)数 如果从任一节点观看网络都一样,则称网络为对称的(Symmetry),静态互连网络(1),一维线性阵列(1-D Linear Array) 并行机中最简单、最基本的互连方式, 每个节点只与其左、右近邻相连,也叫二近邻连接 N个节点用N-1条边串接之,内节点度为2,直径为N-1,对剖宽度为1 当首、尾节点相连时可构成循环移位器,在拓扑结构上等同于环,环可以是单向的或双向的,其节点度恒为2,直径或为 (双向环)或为N-1(单向环),对剖宽度为2,静态互连网络(2),二维网孔(2-D Mesh) 每个节点只与其上、下、左、右的近邻相连(边界节点除外),节点度为

5、4,网络直径为 ,对剖宽度为 在垂直方向上带环绕,水平方向呈蛇状,就变成Illiac网孔了,节点度恒为4,网络直径为 ,而对剖宽度为 垂直和水平方向均带环绕,则变成了2-D环绕(2-D Torus),节点度恒为4,网络直径为 ,对剖宽度为,静态互连网络(3),静态互连网络(4),二叉树: 除了根、叶节点,每个内节点只与其父节点和两个子节点相连。 节点度为3,对剖宽度为1,而树的直径为 如果尽量增大节点度为N-1,则直径缩小为2,此时就变成了星形网络,其对剖宽度为 传统二叉树的主要问题是根易成为通信瓶颈。胖树节点间的通路自叶向根逐渐变宽。,静态互连网络(5),静态互连网络(6),超立方 一个n-

6、立方由 个顶点组成,3-立方如图(a)所示;4-立方如图(b)所示,由两个3-立方的对应顶点连接而成。 n-立方的节点度为n,网络直径也是n ,而对剖宽度为N/2。 如果将3-立方的每个顶点代之以一个环就构成了如图(d)所示的3-立方环,此时每个顶点的度为3,而不像超立方那样节点度为n。,静态互连网络(7),嵌入,将网络中的各节点映射到另一个网络中去 用膨胀(Dilation)系数来描述嵌入的质量,它是指被嵌入网络中的一条链路在所要嵌入的网络中对应所需的最大链路数 如果该系数为1,则称为完美嵌入。 环网可完美嵌入到2-D环绕网中 超立方网可完美嵌入到2D环绕网中,嵌入,Ring onto 2-

7、D torus Hypercube onto 2-D torus,静态互连网络特性比较,动态互连网络 (1),总线:PCI、VME、Multics、Sbus、MicroChannel 多处理机总线系统的主要问题包括总线仲裁、中断处理、协议转换、快速同步、高速缓存一致性协议、分事务、总线桥和层次总线扩展等,动态互连网络(2),交叉开关(Crossbar): 单级交换网络,可为每个端口提供更高的带宽。象电话交换机一样,交叉点开关可由程序控制动态设置其处于“开”或“关”状态,而能提供所有(源、目的)对之间的动态连接。 交叉开关一般有两种使用方式:一种是用于对称的多处理机或多计算机机群中的处理器间的通

8、信;另一种是用于SMP服务器或向量超级计算机中处理器和存储器之间的存取。,动态互连网络(3),单级交叉开关级联起来形成多级互连网络MIN(Multistage Interconnection Network),动态互连网络(4),交换开关模块 一个交换开关模块有n个输入和n个输出,每个输入可连接到任意输出端口,但只允许一对一或一对多的映射,不允许多对一的映射,因为这将发生输出冲突 级间互连(Interstage Connection ) 均匀洗牌、蝶网、多路均匀洗牌、交叉开关、立方连接 n输入的网络需要 级22开关,在Ilinois大学的Cedar多处理机系统中采用了网络 Cray Y/MP多

9、级网络,该网络用来支持8个向量处理器和256个存储器模块之间的数据传输。网络能够避免8个处理器同时进行存储器存取时的冲突。,动态互连网络比较,n,节点规模 w,数据宽度,标准互连网络(1),Myrinet: Myrinet是由Myricom公司设计的千兆位包交换网络,其目的是为了构筑计算机机群,使系统互连成为一种商业产品。 Myrinet是基于加州理工学院开发的多计算机和VLSI技术以及在南加州大学开发的ATOMIC/LAN技术。Myrinet能假设任意拓扑结构,不必限定为开关网孔或任何规则的结构。 Myrinet在数据链路层具有可变长的包格式,对每条链路施行流控制和错误控制,并使用切通选路法

10、以及定制的可编程的主机接口。在物理层上,Myrinet网使用全双工SAN链路,最长可达3米,峰值速率为(1.281.28)Gbps(目前有2.56+2.56) Myrinet交换开关 :8,12,16端口 Myrinet主机接口 : 32位的称作LANai芯片的用户定制的VLSI处理器,它带有Myrinet接口、包接口、DMA引擎和快速静态随机存取存储器SRAM。,Myrinet连接的LAN/Cluster,标准互连网络(2),高性能并行接口(HiPPI) Los Alamos国家实验室于1987年提出的一个标准,其目的是试图统一来自不同产商生产的所有大型机和超级计算机的接口。在大型机和超级计

11、算机工业界,HiPPI作为短距离的系统到系统以及系统到外设连接的高速I/O通道。 1993年,ANSI X3T9.3委员会认可了HiPPI标准,它覆盖了物理和数据链路层,但在这两层之上的任何规定却取决于用户。 HiPPI是个单工的点到点的数据传输接口,其速率可达800Mbps到1.6Gbps。 开发成功了一种能提供潜在的6.4Gbps速率,比HiPPI快8倍且有很低时延的超级HiPPI技术, SGI公司和Los Alamos国家实验室都开发了用来构筑速率高达25.6Gbps的HiPPI交换开关的HiPPI技术。 HiPPI通道和HiPPI交换开关被用在SGI Power Challenge服务

12、器、IBM 390主机、Cray Y/MP、C90和T3D/T3E等系统,使用HiPPI通道和开关构筑的LAN主干网,标准互连网络(3),光纤通道FC(Fiber Channel) : 通道和网络标准的集成 光纤通道既可以是共享介质,也可以是一种交换技术 光纤通道操作速度范围可从100到133、200、400和800Mbps。FCSI厂商也正在推出未来具有更高速度(1、2或4Gbps)的光纤通道 光纤通道的价值已被现在的某些千兆位局域网所证实,这些局域网就是基于光纤通道技术的 连网拓扑结构的灵活性是光纤通道的主要财富,它支持点到点、仲裁环及交换光纤连接 FDDI : 光纤分布式数据接口FDDI

13、(Fiber Distributed Data Interface) FDDI采用双向光纤令牌环可提供100-200Mbps数据传输速率 FDDI具有互连大量设备的能力 传统的FDDI仅以异步方式操作,双向FDDI环作为主干网,标准互连网络(4),ATM(Asynchronous Transfer Mode): 由成立于1991年的ATM论坛和ITU标准定义 ATM是一种独立于介质的消息传输协议,它将消息段变成更短的固定长度为53字节的报元进行传输。 这种技术是基于报元交换机制。ATM的目的是将实时和突发数据的传输合并成单一的网络技术。 ATM网络支持从25到51、155和622Mbps不同的

14、速率,其速率越低ATM交换器和使用的链路价格越低。,香港大学开发的Pearl机群,标准互连网络(5),第二章 并行计算机系统互连与基本通信操作,2.1 并行计算机互连网络 2.1.1 静态互连网络 2.1.2 动态互连网络 2.1.3 标准互连网络 2.2 选路方法与开关技术 2.3 单一信包一到一传输 2.4 一到多播送 2.5 多到多播送,预备知识,选路(Routing) 又称为选径或路由。产生消息从发源地到目的地所取的路径, 要求具有较低通信延迟、无死锁和容错能力。应用于网络或并行机上的信息交换。 消息、信包、片 消息(Message):是在多计算机系统的处理接点之间传递包含数据和同步消

15、息的信息包。它是一种逻辑单位,可由任意数量的包构成。 包(Packet):包的长度随协议不同而不同,它是信息传送的最小单位,64-512位。 片(Flit):片的长度固定,一般为8位。,预备知识,消息、信包、片的相互关系,预备知识,一些术语 信道带宽b:每个信道有w位宽和信号传输率f = 1/t (t是时钟周期), b = wf bits/sec 节点和开关的度:与节点和开关相连的信道数目 路径:信包在网络中走过的开关和链路(link)序列 路由长度或距离:路由路径中包括的链路(link)数目 信包传输性能参数 启动时间ts(startup time):准备包头信息等 节点延迟时间th(per

16、-hop time):包头穿越相邻节点的时间 字传输时间tw(transfer time):传输每个字的时间 链路数l 、信包大小m,预备知识,选路算法的三种机制 基于算术的: 开关中具有简单的算术运算功能,如维序选路; 基于源地址的: 在源点时就将沿路径的各个开关的输出端口地址p0,p1,pn包在信包的头部,每个开关只是对信包头的输出端口地址进行剥离; 基于查表的: 开关中含有一个选路表,对信包头中的选路域查出输出端口地址。,预备知识,选路方式,选路方法,分类 最短路径/非最短路径(贪心选路/随机选路), 如维序选路是贪心的,二阶段维序选路是随机的 确定选路/自适应选路(寻径确定/寻径视网络状况) 维序选路(Dimension-Ordered Routing):一种确定的最短路径选路 二维网孔中的维序选路: X-Y选路 超立

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号