能计算系统的构建与应用--中心机房建设内容与应用背景介

上传人:枫** 文档编号:570083637 上传时间:2024-08-01 格式:PPT 页数:55 大小:273.01KB
返回 下载 相关 举报
能计算系统的构建与应用--中心机房建设内容与应用背景介_第1页
第1页 / 共55页
能计算系统的构建与应用--中心机房建设内容与应用背景介_第2页
第2页 / 共55页
能计算系统的构建与应用--中心机房建设内容与应用背景介_第3页
第3页 / 共55页
能计算系统的构建与应用--中心机房建设内容与应用背景介_第4页
第4页 / 共55页
能计算系统的构建与应用--中心机房建设内容与应用背景介_第5页
第5页 / 共55页
点击查看更多>>
资源描述

《能计算系统的构建与应用--中心机房建设内容与应用背景介》由会员分享,可在线阅读,更多相关《能计算系统的构建与应用--中心机房建设内容与应用背景介(55页珍藏版)》请在金锄头文库上搜索。

1、高可用与高性能计算系统的 构建与应用 -中心机房建设内容与应用背景介绍中心机房建设内容与应用背景介绍 20062006年年3 3月月2 2日日高可用与高性能计算系统的构建与应用高可用与高性能计算系统的构建与应用汇报试图解答两个问题:汇报试图解答两个问题:中心机房可以提供哪些超越微机中心机房可以提供哪些超越微机系统的实验平台?系统的实验平台?在这样的平台上可望进行哪些研在这样的平台上可望进行哪些研究、开发与技术积奠?究、开发与技术积奠?高可用与高性能计算系统的构建与应用高可用与高性能计算系统的构建与应用1.1.建设目标与应用背景建设目标与应用背景2.2.主要设备及技术参数主要设备及技术参数3.3

2、.高性能计算高性能计算4.4.高可用集群高可用集群5.5.网格计算网格计算6.6.接入技术接入技术7.7.信息安全信息安全8.8.下一代互联网下一代互联网. .建设目标与应用背景建设目标与应用背景智能安全态势智能安全态势监控保障体系监控保障体系专用芯片设计专用芯片设计关键技术关键技术语音图像语音图像关键技术关键技术实用智能实用智能关键技术关键技术软件平台软件平台 硬件平台硬件平台 专用设备专用设备 . .建设目标与应用背景建设目标与应用背景按照项目任务书,按照项目任务书,985985工程工程“智能化智能化国防安全信息技术国防安全信息技术”项目的建设内容包括项目的建设内容包括基础平台建设、关键技

3、术研究、智能安全基础平台建设、关键技术研究、智能安全态势监控保障体系开发这样三个层面。基态势监控保障体系开发这样三个层面。基础开发平台建设主要是建立一套网络化共础开发平台建设主要是建立一套网络化共享的基础开发软硬件平台,为其他两个层享的基础开发软硬件平台,为其他两个层面的研究提供软硬件支撑面的研究提供软硬件支撑1.1.建设目标与应用背景建设目标与应用背景中心机房作为整个基础平台的一部分,主要目标是中心机房作为整个基础平台的一部分,主要目标是建立一个网络化共享的高可用建立一个网络化共享的高可用(HA,High-Availability)与与高性能计算高性能计算(HPC,High Performa

4、nce Computing)服务器系服务器系统统, ,提供高可靠的数据存储中心,为满足后续研究提供提供高可靠的数据存储中心,为满足后续研究提供必要的计算、存储、信息安全等实验平台必要的计算、存储、信息安全等实验平台 中心机房建成后,也将有助于弥补我们在信息技术中心机房建成后,也将有助于弥补我们在信息技术高端设备上不足,适应社会上前沿计算机应用技术发展高端设备上不足,适应社会上前沿计算机应用技术发展的趋势,增强申报和承接信息类项目的能力,同时提高的趋势,增强申报和承接信息类项目的能力,同时提高培养高素质技术人才的实力培养高素质技术人才的实力1.1.建设目标与应用背景建设目标与应用背景中心机房的建

5、立,可以提供微机环境下所不具备的某中心机房的建立,可以提供微机环境下所不具备的某些实验平台,用户可通过终端或模式使用系统些实验平台,用户可通过终端或模式使用系统资源,可为下述几方面提供实验平台:资源,可为下述几方面提供实验平台:l基于基于SMPSMP与与ClusterCluster的高性能计算;的高性能计算;l高可用集群的性能优化;高可用集群的性能优化;l网格计算;网格计算;l高端计算机系统的接入技术;高端计算机系统的接入技术;l网络对抗与信息安全的策略研究;网络对抗与信息安全的策略研究;l下一代互联网(下一代互联网(NGI)NGI)的应用开发等的应用开发等2.2.主要设备及技术参数主要设备及

6、技术参数 2.1 2.1 高性能计算系统高性能计算系统 2.2 2.2 高可靠存储系统高可靠存储系统 2.3 2.3 双协议栈网络交换系统双协议栈网络交换系统 2.4 2.4 信息安全系统信息安全系统 中心机房配置的大型设备及其技术指中心机房配置的大型设备及其技术指标详见相关附件。标详见相关附件。 .1 .1 高性能计算系统高性能计算系统 (1) (1) 小型机系统小型机系统 中心机房配备了四台小型机,分别是中心机房配备了四台小型机,分别是IBMIBM公公司的司的P550P550和和P520,P520,以及以及HPHP公司的公司的RX4640RX4640和和RX2620.RX2620. 小型机

7、具有优异的浮点计算性能、出色的内小型机具有优异的浮点计算性能、出色的内存扩充能力、大容量高速缓存和优越的存扩充能力、大容量高速缓存和优越的SMPSMP处理处理特性特性, , 它还支持增强的错误检测、纠正和容错能它还支持增强的错误检测、纠正和容错能力力, , 这些特性是微机服务器所不具备的。这些特性是微机服务器所不具备的。小型机软件专用,互通性差,价格昂贵,配小型机软件专用,互通性差,价格昂贵,配备不好将导致可用性差备不好将导致可用性差, ,通过在小型机上安装通过在小型机上安装Linux ASLinux AS操作系统,以及利用操作系统,以及利用ITIT厂商的大学合作厂商的大学合作计划,可以扩大工

8、具软件来源。计划,可以扩大工具软件来源。 (2) (2) 刀片式服务器刀片式服务器 刀片式服务器是由许多松耦合的处理单刀片式服务器是由许多松耦合的处理单元组成的,每个单元内的元组成的,每个单元内的CPUCPU都有自己私有的都有自己私有的资源,如总线,内存,硬盘等。在每个单元资源,如总线,内存,硬盘等。在每个单元内都有操作系统和管理数据库的实例复本。内都有操作系统和管理数据库的实例复本。与与SMP (Symmetric Multi Processing),SMP (Symmetric Multi Processing),不同,不同,这种结构最大的特点在于不共享内存资源。这种结构最大的特点在于不共

9、享内存资源。因为要在不同处理单元之间传送信息,所以因为要在不同处理单元之间传送信息,所以其效率很大程度依赖于各单元间的通信效率其效率很大程度依赖于各单元间的通信效率, ,但具有更高的容错性但具有更高的容错性(2)(2)刀片式服务器刀片式服务器中心机房配备了中心机房配备了 IBM IBM BladeCenterBladeCenter HS20 HS20和和HP HP ProLiantProLiant BL20p G2 BL20p G2两款各带有两款各带有4 4片双处片双处理器单元的刀片式服务器,每个刀片采用高理器单元的刀片式服务器,每个刀片采用高性能的性能的Intel(RIntel(R) ) X

10、eonTMXeonTM 2.8GHz 2.8GHz处理器,带处理器,带有有SANSAN存储能力,内置存储能力,内置GBGB的的PC 2100 DDRPC 2100 DDR内内存和千兆以太网卡,以及两个存和千兆以太网卡,以及两个73GB SCSI73GB SCSI硬盘硬盘利用刀片式服务器可以研究集群结构下许利用刀片式服务器可以研究集群结构下许多事务处理和科学计算的并行算法多事务处理和科学计算的并行算法, ,降低集群降低集群管理的难度和高性能计算的成本。管理的难度和高性能计算的成本。( () ) 企业级微机服务器企业级微机服务器 企业级微机服务器开放性强,操作系统适企业级微机服务器开放性强,操作系

11、统适应面广,市场容量大,性价比较高。应面广,市场容量大,性价比较高。本次采购的本次采购的HP DL580G3HP DL580G3微机服务器,配置四微机服务器,配置四个个Intel Xeon MP EM64TIntel Xeon MP EM64T 3.0GHz3.0GHz处理器,处理器,前端总线前端总线667MHz667MHz, ECCECC内存内存8GB8GB,每处理器有,每处理器有二级高速缓存二级高速缓存1MB1MB,并可扩展至,并可扩展至64GB64GB,内置,内置2*73.4GB2*73.4GB热插拔热插拔SCSISCSI硬盘硬盘, , 包含包含RAID RAID 适配器,适配器,集成双

12、千兆以太网卡,配置光纤通道卡集成双千兆以太网卡,配置光纤通道卡(HBAHBA),带有),带有2 2个热插拔冗余电源适合在个热插拔冗余电源适合在indowsindows或或LinuxLinux环境下的环境下的HAHA或或HPCHPC研究研究2.2 2.2 高可靠海量存储系统高可靠海量存储系统智能化安全信息技术项目研究中涉智能化安全信息技术项目研究中涉及多学科跨平台合作,每个分项都有及多学科跨平台合作,每个分项都有大量信息需要备份存储,相互之间需大量信息需要备份存储,相互之间需要进行必要的数据共享,而且对数据要进行必要的数据共享,而且对数据存储的可靠性和安全度要求很高,中存储的可靠性和安全度要求很

13、高,中心机房作为项目的计算中心和数据中心机房作为项目的计算中心和数据中心,采用先进的光纤通道存储区域网心,采用先进的光纤通道存储区域网络(络(SAN)以适应存储需求。)以适应存储需求。 2.2 2.2 高可靠海量存储系统高可靠海量存储系统在在2020世纪世纪8080年代,连接主机和存储设备年代,连接主机和存储设备的标准方法是通过像的标准方法是通过像IDEIDE或并行或并行SCSISCSI这样的这样的接口实现的点对点的接口实现的点对点的DASDAS(直接连接存储)(直接连接存储)方式。并行方式。并行SCSISCSI提供了相对快速的访问提供了相对快速的访问SCSISCSI硬盘的速度硬盘的速度, ,

14、并且几个硬盘可以通过同一个并且几个硬盘可以通过同一个接口连接到计算机上。接口连接到计算机上。 但是,随着存储子系统变得越来越大,但是,随着存储子系统变得越来越大,计算机变得越来越快,同时,计算机变得越来越快,同时,I/OI/O速率也在速率也在不断增长,上述连接方式出现不少新问题不断增长,上述连接方式出现不少新问题2.2 2.2 高可靠海量存储系统高可靠海量存储系统为了满足这些新的需求,人们开发为了满足这些新的需求,人们开发了为存储设备提供千兆串行网络访问能了为存储设备提供千兆串行网络访问能力的光纤通道(力的光纤通道(FibreFibre Channel Channel)协议。)协议。在光纤通道

15、协议的第四层上建立了以光在光纤通道协议的第四层上建立了以光纤通道为基础的用于存储的纤通道为基础的用于存储的SCSISCSI协议、协议、光纤通道协议综合了许多优点,使得光光纤通道协议综合了许多优点,使得光纤通道协议作为并行纤通道协议作为并行SCSISCSI协议的替代者协议的替代者得到了人们的认可,现在光纤通道协议得到了人们的认可,现在光纤通道协议被用在绝大多数高容量、高端直连存储被用在绝大多数高容量、高端直连存储设备上。设备上。2.2 2.2 高可靠海量存储系统高可靠海量存储系统随着光纤通道协议作为并行随着光纤通道协议作为并行SCSISCSI的方式的方式替代者的出现,并随着其逐渐被市场所接受,替

16、代者的出现,并随着其逐渐被市场所接受,一种组合单纯的存储应用与网络技术于一身的一种组合单纯的存储应用与网络技术于一身的新技术出现了新技术出现了这就是存储区域网络这就是存储区域网络(Storage Area NetworkStorage Area Network,SANSAN)。)。SANSAN是一个是一个由存储设备和交换系统构成的网络,所有的通由存储设备和交换系统构成的网络,所有的通信都在一个光纤通道的网络上完成。信都在一个光纤通道的网络上完成。SANSAN的特的特点是:支持各种操作系统(点是:支持各种操作系统(AIXAIX、SolarisSolaris、HP/UXHP/UX、LinuxLin

17、ux、WindowsWindows)通用的数据访问)通用的数据访问 、无缝的可扩展性无缝的可扩展性 和集中的管理。可以为项目和集中的管理。可以为项目研究提供通用、高速、可靠的集中存储单元。研究提供通用、高速、可靠的集中存储单元。2.2 2.2 高可靠海量存储系统高可靠海量存储系统HBA光纤通道交换机Fiber Switch光纤通道存储设备心跳网络图2 Cluster+SAN系统解决方案Fiber Switch 2.2 2.2 高可靠海量存储系统高可靠海量存储系统中心机房配置的中心机房配置的SANSAN系统,系统, 光纤通道光纤通道交换机带有交换机带有1212个接口,单个光纤接口速度个接口,单个

18、光纤接口速度2GB/s2GB/s;光纤网络存储柜带有双光纤网络存储柜带有双RAIDRAID控制器,控制器,含含4 4个个2Gbps2Gbps光纤通道(光纤通道(FCFC) 硬盘数目为硬盘数目为2828个个146GB 10000RPM146GB 10000RPM光纤硬盘,最大可扩光纤硬盘,最大可扩充硬盘数充硬盘数 108108个个, ,支持多种支持多种RAIDRAID级别级别, ,支持支持的操作系统包括的操作系统包括HP-UXHP-UX、Windows NTWindows NT、Windows 2000Windows 2000、Windows Server 2003Windows Server

19、2003、Sun SolarisSun Solaris、AIXAIX、RedhatRedhat Linux Linux2.3 2.3 双协议栈网络交换系统双协议栈网络交换系统目前目前CERNETCERNET上连通地区节点的上连通地区节点的IP V6IP V6高高速专线即将开通,第二代互联网速专线即将开通,第二代互联网(CNGI)(CNGI)很快很快会进入实用状态会进入实用状态, , 同时同时IPv4IPv4也将长期共存。也将长期共存。中心机房的网络设备必须适应这种发展趋势,中心机房的网络设备必须适应这种发展趋势,支持支持IPv6IPv6和和IPv4IPv4双协议栈双协议栈 IP v6IP v6

20、在网络传在网络传输的许多特性上优于输的许多特性上优于IP v4,IP v4,但是如何架构基但是如何架构基于于NGINGI的应用,将网络层的优势发挥出来则的应用,将网络层的优势发挥出来则远未解决,机房配置的双协议栈路由器和交远未解决,机房配置的双协议栈路由器和交换机,除支撑日常运行外,尚可用于构造换机,除支撑日常运行外,尚可用于构造IP IP v6v6小型实验网,支持小型实验网,支持NGINGI的应用开发研究的应用开发研究2.4 2.4 信息安全系统信息安全系统中心机房作为项目的计算中心和数据中中心机房作为项目的计算中心和数据中心,对数据存储的可靠性和安全度要求较心,对数据存储的可靠性和安全度要

21、求较高,为保障信息的安全,购置了包括防火高,为保障信息的安全,购置了包括防火墙、防毒墙、入侵检测、安全隐患扫瞄、墙、防毒墙、入侵检测、安全隐患扫瞄、VPNVPN等安全设备。等安全设备。这些安全设备除了为项目这些安全设备除了为项目研究提供数据安全保障外,也将有助于信研究提供数据安全保障外,也将有助于信息安全技术研究和相关技术人才的培养,息安全技术研究和相关技术人才的培养,可以剖析、掌握、发展最新网络安全技术,可以剖析、掌握、发展最新网络安全技术,开展网络攻防和信息安全的策略研究。开展网络攻防和信息安全的策略研究。高性能计算高性能计算HPC:HighHPC:High Performance Com

22、puting Performance Computing是能够是能够突破性能极限,超越单台高端工作站计算水平,突破性能极限,超越单台高端工作站计算水平,需要通过专门的程序优化,最大限度提高系统的需要通过专门的程序优化,最大限度提高系统的I/OI/O、计算和数据传送性能的计算模式,、计算和数据传送性能的计算模式,HPCHPC可以可以不同程度地提升解题的规模、速度和精度。不同程度地提升解题的规模、速度和精度。 当前常用的当前常用的HPCHPC平台主要集中于平台主要集中于SMPSMP主机与主机与IAIA架构集群当然单有适用的硬件平台并不能带来架构集群当然单有适用的硬件平台并不能带来HPCHPC,关键

23、在于将串行的计算程序改造为高性能,关键在于将串行的计算程序改造为高性能的并行计算。的并行计算。 高性能计算高性能计算SMP SMP (Symmetric Multi Processing)(Symmetric Multi Processing)系统系统的特点是的特点是多处理器共享内存资源,由于免除多处理器共享内存资源,由于免除机机间通信瓶颈,故间通信瓶颈,故SMPSMP目前仍然是目前仍然是HPCHPC的重要平台的重要平台多处理器事实上包含多处理器事实上包含超线程、双核、多超线程、双核、多CPUCPU等等结构。超线程技术(结构。超线程技术(HyperthreadingHyperthreading

24、 TechnologyTechnology)是)是IntelIntel公司的创新设计。公司的创新设计。HTHT技术技术就是利用特殊的硬件指令,把两个逻辑内核模就是利用特殊的硬件指令,把两个逻辑内核模拟成两个物理芯片,让单个处理器都能使用线拟成两个物理芯片,让单个处理器都能使用线程级并行计算,从而兼容多线程操作系统和软程级并行计算,从而兼容多线程操作系统和软件,并提高处理器的性能。超线程技术只是对件,并提高处理器的性能。超线程技术只是对服务器性能的一种挖潜式的提升服务器性能的一种挖潜式的提升高性能计算高性能计算 双核处理器是基于单个半导体的一个处双核处理器是基于单个半导体的一个处理器上拥有两个一

25、样功能的处理器核心。从理器上拥有两个一样功能的处理器核心。从而处理器每个时钟周期内可执行的单元数将而处理器每个时钟周期内可执行的单元数将增加一倍。双处理器结构的引入和微软下一增加一倍。双处理器结构的引入和微软下一代操作系统将在很大程度上促进虚拟技术的代操作系统将在很大程度上促进虚拟技术的发展。即让一台物理计算机虚拟出若干个虚发展。即让一台物理计算机虚拟出若干个虚拟的系统,允许用户在他们的拟的系统,允许用户在他们的PCPC上使用超过上使用超过一个操作系统,以便每个操作系统解决特定一个操作系统,以便每个操作系统解决特定的运算任务的运算任务. .这些技术在这些技术在2006-20072006-200

26、7年将成为年将成为计算机平台的新亮,并且将使计算机的功能计算机平台的新亮,并且将使计算机的功能达到全新的水平。达到全新的水平。高性能计算高性能计算与单核处理器相比,多核处理器能在与单核处理器相比,多核处理器能在一些应用领域带来更为强大的动力,比如海一些应用领域带来更为强大的动力,比如海量数据处理、大规模网络应用、复杂科学计量数据处理、大规模网络应用、复杂科学计算及大型图形建模为特征的企业级或行业关算及大型图形建模为特征的企业级或行业关键应用领域。由于支持并行处理的应用软件键应用领域。由于支持并行处理的应用软件的需求量不断增加,目前大多数新或即将发的需求量不断增加,目前大多数新或即将发布的应用软

27、件都对此类技术提供了支持,整布的应用软件都对此类技术提供了支持,整个软件市场其实已经为多核心处理器架构提个软件市场其实已经为多核心处理器架构提供了充分的准备。供了充分的准备。高性能计算高性能计算这里必须强调,如果要让多处理器系统达到最这里必须强调,如果要让多处理器系统达到最大性能,就必须充分利用所有可执行单元大性能,就必须充分利用所有可执行单元, ,让所有执让所有执行单元都有活可干目前,大多数操作系统已经支行单元都有活可干目前,大多数操作系统已经支持并行处理,在操作系统设计上,从进程持并行处理,在操作系统设计上,从进程(ProcessProcess)演化出线程()演化出线程(ThreadThr

28、ead),最主要的目的),最主要的目的就是更好地支持多处理器。进程是系统资源管理的就是更好地支持多处理器。进程是系统资源管理的最小单位,线程是程序执行的最小单位。将传统的最小单位,线程是程序执行的最小单位。将传统的单进程单线程的计算程序改造为多线程并行计算程单进程单线程的计算程序改造为多线程并行计算程序可以显著提高计算性能,当然这就涉及许多算序可以显著提高计算性能,当然这就涉及许多算法的重新设计法的重新设计, ,并非改变编译选项就能达到并非改变编译选项就能达到. .高性能计算高性能计算 IAIA(Intel Intel ArchetectureArchetecture) )将将HPCHPC带入

29、全带入全新阶段。新阶段。 IAIA集群的瓶颈在于机间通信通过集群的瓶颈在于机间通信通过经济高效的集群方式(例如刀片式结构),经济高效的集群方式(例如刀片式结构),可以达到与可以达到与RISCRISC系统相抗衡的计算能力与运系统相抗衡的计算能力与运算效率。最新公布的算效率。最新公布的TOP500TOP500强中,强中,IAIA架构的架构的系统已经达到系统已经达到119119套,最重要的是,在入围套,最重要的是,在入围TOTO的的IAIA构架系统中,有超过构架系统中,有超过3 3成的系统应用于商成的系统应用于商业计算领域。运用的领域涉及金融预测、药业计算领域。运用的领域涉及金融预测、药物相互作用分

30、析、基因研究、数据挖掘等。物相互作用分析、基因研究、数据挖掘等。HPCHPC开始步入主流。开始步入主流。高性能计算高性能计算 支持集群计算机并行程序开发的软件包,支持集群计算机并行程序开发的软件包, 目前世界上比较流行的有(目前世界上比较流行的有(PVMPVM、ExpressExpress、LindaLinda、MPIMPI)。其中)。其中MPI(MessageMPI(Message Passing Passing Interface)Interface)正成为并行程序设计事实上的工业标正成为并行程序设计事实上的工业标准。当前通用的是准。当前通用的是MPI1.1MPI1.1规范。正在制定的规范

31、。正在制定的MPI2.0MPI2.0规范除支持消息传递外,还支持规范除支持消息传递外,还支持MPIMPI的的I/OI/O规范和进程管理规范。规范和进程管理规范。MPIMPI的主要内容是一个消的主要内容是一个消息传递函数库,可以嵌在息传递函数库,可以嵌在C C、C+C+、Fortran Fortran 等程等程序设计语言中调用。实现并行进程之间通过网络序设计语言中调用。实现并行进程之间通过网络相互通信,传递的消息可以是指令、数据、同步相互通信,传递的消息可以是指令、数据、同步信号或中断信号。信号或中断信号。Server HardwareServer HardwareGigaNetGigaNetM

32、yrinetMyrinetFast EthernetFast EthernetVIATCP/IPGMMVICHLAM/MPIMPI/PROMPICHParalletParalletParalletParallet Applications Applications Applications Applications图2.1Beowulf集群组件视图高性能计算高性能计算 MPI MPI 提供的通信规约主要是阻塞式提供的通信规约主要是阻塞式/ /同同步式(步式(BLOCKING COMMUNICATIONBLOCKING COMMUNICATION)和非阻塞)和非阻塞式式/ /异步式(异步式(NO

33、N-BLOCKING NON-BLOCKING COMMUNICATIONCOMMUNICATION),通信应答关系十分严谨,),通信应答关系十分严谨,两种通信方式都支持点两种通信方式都支持点点通信和聚合通信。点通信和聚合通信。点对点通信包括点对点通信包括3 3种模式种模式: :标准标准(Standard) (Standard) 模式、同步模式、同步(Synchronous) (Synchronous) 模式和预备模式和预备(Ready)(Ready)模式。聚合通信包括聚合同步和数模式。聚合通信包括聚合同步和数据交换两方面。聚合同步指调用该操作的任据交换两方面。聚合同步指调用该操作的任务要等到

34、组内所有成员都达到该同步点后才务要等到组内所有成员都达到该同步点后才继续往下执行。继续往下执行。高性能计算高性能计算 数据交换指在一组任务之间一起进行数据交换,它包括4种模式:l 广播(Broadcast),组内一个成员的数据发送给所有成员;l 数据分发(Scatter),组内横向顺序数据交换转为纵向数据;l 数据聚集(Gather),将一个组内纵向数据交换按序传给各个组;l 全数据聚集(Alltoall),将所有组内数据进行纵横方向的交换。高性能计算高性能计算 使用使用ClusterCluster实现实现HPCHPC的关键同样是将传的关键同样是将传统的单进程单线程的计算程序改造为节点机统的单

35、进程单线程的计算程序改造为节点机上并行进程之间通过网络相互通信的并行计上并行进程之间通过网络相互通信的并行计算程序算法的从新设计是最大的难点算程序算法的从新设计是最大的难点 对对HPCHPC系统的性能评价是以测试浮点运系统的性能评价是以测试浮点运算性能为基准的。在计算机科学与工程应用算性能为基准的。在计算机科学与工程应用领域内,浮点计算工作量占很大比例,因此领域内,浮点计算工作量占很大比例,因此机器的浮点性能对系统的应用有很大的影响。机器的浮点性能对系统的应用有很大的影响。 高性能计算高性能计算 自自7070年代中期以来,国际上曾开发过一批年代中期以来,国际上曾开发过一批基于基于Fortran

36、Fortran语言的求解线性代数方程组的子语言的求解线性代数方程组的子程序。程序。19791979年正式发表了年正式发表了LinpackLinpack包,因为线包,因为线性代数方程组在各个领域中应用广泛,这个性代数方程组在各个领域中应用广泛,这个软件包很自然地成为测试各种不同类型机器软件包很自然地成为测试各种不同类型机器性能的测试程序。性能的测试程序。LinpackLinpack测试的基准是用该测试的基准是用该包的全精度(包的全精度(6464位字长)子程序求解位字长)子程序求解100100阶线阶线性方程组的速度。测试的结果以性方程组的速度。测试的结果以MflopsMflops(每(每秒百万次浮

37、点运算)作单位给出。秒百万次浮点运算)作单位给出。 LinpackLinpack已被国际上公认为各类计算机的主要测试程已被国际上公认为各类计算机的主要测试程序之一,并成为广大用户采购机器和各计算序之一,并成为广大用户采购机器和各计算机厂商推销计算机的一项重要性能值表。机厂商推销计算机的一项重要性能值表。高性能计算高性能计算 随着高性能并行机的飞速发展,原来随着高性能并行机的飞速发展,原来LinpackLinpack所所规定的求解规定的求解100100阶方程组的规模显然不能充分反映这阶方程组的规模显然不能充分反映这些计算机的能力。为此到些计算机的能力。为此到8080年代后期,年代后期,Linpa

38、ckLinpack中又中又加上规模加上规模n=1000n=1000的最佳测试结果,允许根据各计算的最佳测试结果,允许根据各计算机系统的具体硬件环境,修改原来算法,以尽可能机系统的具体硬件环境,修改原来算法,以尽可能达到接近峰值的最佳结果(所谓的达到接近峰值的最佳结果(所谓的“TPP”TPP”值,值,Toward Peak PerformanceToward Peak Performance)。)。HPLHPL(High High Performance Performance LinpackLinpack)测试结果是国际)测试结果是国际TOP500TOP500排名排名的重要依据。的重要依据。

39、由于测值的关联因素很多,探索在符合测试标由于测值的关联因素很多,探索在符合测试标准的前提下,提高准的前提下,提高IAIA架构集群性能测试值的方法仍架构集群性能测试值的方法仍然是很有意义的研究课题。然是很有意义的研究课题。4. 4. 高可用集群高可用集群 高可用性(高可用性(High AvailabilityHigh Availability,HAHA)集群是共同为客户机提供网络资源)集群是共同为客户机提供网络资源的一组计算机系统的一组计算机系统 。其中每一台提供服。其中每一台提供服务的计算机称为节点务的计算机称为节点(Node)(Node)。当一个节。当一个节点不可用或者不能处理客户的请求时,

40、点不可用或者不能处理客户的请求时,该请求会及时转到另外的可用节点来处该请求会及时转到另外的可用节点来处理,从而实现负载均衡和不间断应用的理,从而实现负载均衡和不间断应用的目标目标, , 而这些对于客户端是透明的,客而这些对于客户端是透明的,客户不必关心要使用资源的具体位置,集户不必关心要使用资源的具体位置,集群系统会自动完成。群系统会自动完成。4. 4. 高可用集群高可用集群 ClusterCluster应用可分为三方面:应用可分为三方面:High-High-Availability(HAAvailability(HA)()(高可用性集群高可用性集群) )、Load Load Balance(

41、Balance(负载均衡集群负载均衡集群) )、 High Performance High Performance ComputingComputing(HPC)HPC)( (高性能计算集群高性能计算集群) )。在集群的。在集群的这三种基本类型之间,经常会发生混合与交这三种基本类型之间,经常会发生混合与交杂。由于保证持续稳定的系统运行变得越来杂。由于保证持续稳定的系统运行变得越来越重要,而传统意义上的小型机系统让普通越重要,而传统意义上的小型机系统让普通用户望而却步用户望而却步, ,用户需要更高的可用性以及更用户需要更高的可用性以及更低的成本低的成本, ,因而因而 HA ClusterHA

42、Cluster是信息化工程中是信息化工程中迫切需要的一项技术迫切需要的一项技术, ,值得认真掌握和潜心探值得认真掌握和潜心探讨讨. .4. 4. 高可用集群高可用集群 HA Cluster HA Cluster 主要用于事务处理主要用于事务处理, ,目前比较目前比较典型的商用软件产品有典型的商用软件产品有: : Oracle Database 9i Oracle Database 9i 和和10g 10g 的的RAC(RealRAC(Real Application Cluster)Application Cluster)组件组件; ; IBM IBM WebSphereWebSphere 和

43、和BEA BEA WebLogicWebLogic 的的WEBWEB应用服务中间件(实现应用服务中间件(实现HA WebHA Web服务器服务器).). 刀片式服务器是这两种典型应用理想的安刀片式服务器是这两种典型应用理想的安装平台,这些组件的运用与开发具有较高的装平台,这些组件的运用与开发具有较高的技术难度,剖析其实现机制和技术规范很有技术难度,剖析其实现机制和技术规范很有必要。这将有助于在集群上开发其它必要。这将有助于在集群上开发其它HAHA软件软件产品产品, ,比如网络信息流的分析监控等比如网络信息流的分析监控等. .4. 4. 高可用集群高可用集群 事务处理系统的性能评价通常采用事务处

44、理系统的性能评价通常采用TPCTPC测测试试.TPC.TPC是是Transaction Processing Transaction Processing Performance CouncilPerformance Council(事务处理委员会)的(事务处理委员会)的缩写。缩写。TPCTPC系列基准程序是由系列基准程序是由TPCTPC开发的评价开发的评价计算机事务处理与数据库性能的测试程序,计算机事务处理与数据库性能的测试程序,用以评价计算机在事务处理、数据库处理、用以评价计算机在事务处理、数据库处理、企业管理与决策支持系统等方面的性能,其企业管理与决策支持系统等方面的性能,其评测结果用每

45、秒完成的事务处理数来表示。评测结果用每秒完成的事务处理数来表示。TPCTPC基准测试程序在商业范围内建立了用于衡基准测试程序在商业范围内建立了用于衡量机器性能以及性能价格比的标准。量机器性能以及性能价格比的标准。TPCTPC目前目前主要制定了四种数据库测试标准:主要制定了四种数据库测试标准: TPC-CTPC-C、TPC-WTPC-W、TPC-RTPC-R、TPC-HTPC-H和和TPC-W.TPC-W.4. 4. 高可用集群高可用集群 其中其中TPC-CTPC-C用来测试用来测试Database Database OLTP(OnOLTP(On- -Line Transaction Proce

46、ssingLine Transaction Processing,在线联机,在线联机事务处理测试事务处理测试). ). 主要由相对简单的主要由相对简单的Read Read only only 和和UpdateUpdate请求构成,这种基准测试项请求构成,这种基准测试项目对包括查询、更新及队列式小批量事务在目对包括查询、更新及队列式小批量事务在内的广泛数据库功能进行测试。它模拟了一内的广泛数据库功能进行测试。它模拟了一个比较复杂并具有代表意义的个比较复杂并具有代表意义的OLTPOLTP应用环境应用环境大型商品批发商的货物管理环境大型商品批发商的货物管理环境. .许多许多ITIT专业人员将专业人员

47、将TPC-CTPC-C视为衡量视为衡量OLTPOLTP系统性能系统性能的有效指示器。的有效指示器。5. 5. 网格计算网格计算 HPCHPC的趋势是与网格结合。网格计算的趋势是与网格结合。网格计算(grid computing)可以合理而有效地将远程资源高效地组织可以合理而有效地将远程资源高效地组织起来,形成起来,形成“网络虚拟计算机网络虚拟计算机”,以获得超强的计算,以获得超强的计算能力。相对于机群计算环境,它具有范围更广、功能能力。相对于机群计算环境,它具有范围更广、功能更强大、组织和管理更复杂的特点。同时,由于网络更强大、组织和管理更复杂的特点。同时,由于网络环境的异构性、可扩展性和网络

48、虚拟环境的动态自适环境的异构性、可扩展性和网络虚拟环境的动态自适应特征,使这类系统在开发软件、并行工具和应用程应特征,使这类系统在开发软件、并行工具和应用程序方面都存在着较大的挑战。中心机房多种异构的主序方面都存在着较大的挑战。中心机房多种异构的主机系统,以及高速的网络互联和网络存储系统,可以机系统,以及高速的网络互联和网络存储系统,可以为网格计算的研究提供小型仿真环境。为网格计算的研究提供小型仿真环境。动态虚拟组织B形成后用于解决金融建模问题动态虚拟组织A形成后提供天气预报 虚拟组织内系统资源共享的动态优点虚拟组织内系统资源共享的动态优点用户用户虚拟组织是逻辑实体有限的生命期动态创建以解决特

49、定问题为解决问题按需分配和供 应资源软件应用程序提供者ASP天气预报数学建模应用 硬件服务提供者计算机集群计算机系统网络带宽按需LinuxBlade服务器金融专家服务提供者C金融建模数据库系统5. 5. 网格计算网格计算 网络环境下的互操作意味着需要开发一套通用协网络环境下的互操作意味着需要开发一套通用协议,用它来描述消息的格式和消息交换的规则。在协议,用它来描述消息的格式和消息交换的规则。在协议之上,需要开发一系列服务,这与建立在议之上,需要开发一系列服务,这与建立在TCP/IPTCP/IP协协议上的议上的WebWeb服务原理相同。在服务中要定义服务原理相同。在服务中要定义APIAPI,基于

50、,基于这些这些APIAPI再构建软件开发工具再构建软件开发工具(SDK)(SDK)。 IBMIBM宣布投入数宣布投入数十亿美元研发网格计算,与十亿美元研发网格计算,与GlobusGlobus合作开发开放的网合作开发开放的网格计算标准,并宣称网格的价值不仅仅限于科学计算,格计算标准,并宣称网格的价值不仅仅限于科学计算,商业应用也有很好的前景。于是网格计算和商业应用也有很好的前景。于是网格计算和GlobusGlobus从从幕后走到前台,受到前所未有的关注。幕后走到前台,受到前所未有的关注。 5. 5. 网格计算网格计算 GlobusGlobus是美国是美国ArgonneArgonne国家实验室的研

51、发项目,国家实验室的研发项目,全美有全美有1212所大学和研究机构参与了该项目。所大学和研究机构参与了该项目。GlobusGlobus对资源管理、安全、信息服务及数据管理对资源管理、安全、信息服务及数据管理等网格计算的关键理论进行研究,开发能在各种等网格计算的关键理论进行研究,开发能在各种平台上运行的网格计算工具软件(平台上运行的网格计算工具软件(ToolkitToolkit),帮),帮助规划和组建大型的网格试验平台,开发适合大助规划和组建大型的网格试验平台,开发适合大型网格系统运行的大型应用程序。型网格系统运行的大型应用程序。GlobusGlobus的技术的技术已在已在NASANASA网格网

52、格(NASA IPG)(NASA IPG)、欧洲数据网格(、欧洲数据网格(Data Data GridGrid)、美国国家技术网格)、美国国家技术网格(NTG)(NTG)等等8 8个项目中得个项目中得到应用。目前的到应用。目前的GlobusGlobus 可以认为是计算网格技术可以认为是计算网格技术的典型代表和事实上的规范。的典型代表和事实上的规范。5. 5. 网格计算网格计算 Globus的网格计算协议建立在互联网协议之上,以互联网协议中的通信、路由、名字解析等功能为基础。Globus的协议分为五层:构造层、连接层、资源层、汇集层和应用层。每层都有自已的服务、API和SDK,可以在Java平台

53、调用。目前,Globus体系结构已为一些大型网格应用所采用。研究人员已经在天气预报、高能物理实验、航空器研究等领域开发了一些基于Globus网格计算的应用程序,较果较好。虽然这些应用虽仍属试验性质,但它至少表明,网格计算可以胜任不少用超级计算机难以胜任的大型应用任务。 5. 5. 网格计算网格计算 随着更多的元计算团体加入随着更多的元计算团体加入GlobusGlobus的研究的研究,它将被开发得更加完善,并将被更多的高级,它将被开发得更加完善,并将被更多的高级应用软件调用。应用软件调用。GlobusGlobus的目标是适应广域网络的目标是适应广域网络资源环境的计算,目前这一类课题的研究还很资源

54、环境的计算,目前这一类课题的研究还很艰巨,作为网格计算中最突出的代表,仍然存艰巨,作为网格计算中最突出的代表,仍然存在着大量问题需要进一步研究,其中网格基础在着大量问题需要进一步研究,其中网格基础理论的研究主要包含四个部分:网格的调度算理论的研究主要包含四个部分:网格的调度算法、网格的数据管理、网格的性能模型及模拟法、网格的数据管理、网格的性能模型及模拟器、网格的体系结构。器、网格的体系结构。 5. 5. 网格计算网格计算 在国内,英特尔与中国教育部宣布,双在国内,英特尔与中国教育部宣布,双方携手构建下一代国家高等教育网格计算平方携手构建下一代国家高等教育网格计算平台。这个庞大的网络计算平台将

55、在未来连接台。这个庞大的网络计算平台将在未来连接中国中国100100所重点高校,实现每秒所重点高校,实现每秒1515万亿次的万亿次的计算能力计算能力. .国家教育部则提供超过国家教育部则提供超过25002500万人万人民币用于应用软件的开发,并在今年将中国民币用于应用软件的开发,并在今年将中国教育网的主接点带宽从教育网的主接点带宽从2G2G扩容到扩容到10G10G。5. 5. 网格计算网格计算 这个分为三个阶段的网格计划,将涉这个分为三个阶段的网格计划,将涉及生命科学、材料科学、石油化工、地震及生命科学、材料科学、石油化工、地震研究甚至商业金融项目等多个领域。研究甚至商业金融项目等多个领域。

56、此外,此外,中国还同时启动了科技部国家网格以及北中国还同时启动了科技部国家网格以及北京、上海城市网格等多个网格计划,京、上海城市网格等多个网格计划,20082008年的奥运会以及年的奥运会以及20102010年的上海世博会,不年的上海世博会,不管是天气预报还是交通信息、医疗卫生,管是天气预报还是交通信息、医疗卫生,都需要大型的网格系统才能完成作业。都需要大型的网格系统才能完成作业。6.6.接入技术接入技术 网格计算通过网络连接地理上分布的各网格计算通过网络连接地理上分布的各类计算机(包括机群)、数据库、类计算机(包括机群)、数据库、 各类设备各类设备和存储设备等,形成对用户相对透明的虚拟和存储

57、设备等,形成对用户相对透明的虚拟的高性能计算环境的高性能计算环境. .在这里,如何实现各种计在这里,如何实现各种计算机外设、检测与伺服装置、智能化仪器仪算机外设、检测与伺服装置、智能化仪器仪表到高性能计算系统的接入,就是一个很有表到高性能计算系统的接入,就是一个很有价值的研究课题。价值的研究课题。6.6.接入技术接入技术由于外部设备通常由单片机或嵌入式计由于外部设备通常由单片机或嵌入式计算机控制,计算资源十分有限,实现这种接算机控制,计算资源十分有限,实现这种接入一方面将极大提高设备的计算能力和智能入一方面将极大提高设备的计算能力和智能化水平,另方面也将丰富网格的数据资源与化水平,另方面也将丰

58、富网格的数据资源与应用范畴。接入网的通信方式可以是有线或应用范畴。接入网的通信方式可以是有线或无线,传输速率可以是超高速和低速,使用无线,传输速率可以是超高速和低速,使用协议可以是协议可以是IPIP或底层的链路协议。事实上,或底层的链路协议。事实上,在目标检测与跟踪系统中,迫切需要这样的在目标检测与跟踪系统中,迫切需要这样的处理模式。处理模式。6.6.接入技术接入技术 接入的信息资源可以是数字式仪器仪表接入的信息资源可以是数字式仪器仪表的检测数字,的检测数字,GPSGPS坐标数据、静态图象数据,坐标数据、静态图象数据,也可以是流式视音频等连续媒体数据。进入也可以是流式视音频等连续媒体数据。进入

59、HPCHPC主机系统后,可以进行特征识别和控制主机系统后,可以进行特征识别和控制策略优化等处理,而后又可利用接入系统向策略优化等处理,而后又可利用接入系统向伺服装置发送控制指令。这种模式可望实现伺服装置发送控制指令。这种模式可望实现广域范围的智能监控。广域范围的智能监控。7. 7. 信息安全信息安全 中心机房目前配置的防火墙、防毒墙、入中心机房目前配置的防火墙、防毒墙、入侵检测、安全隐患扫描、侵检测、安全隐患扫描、VPNVPN等安全设备,代等安全设备,代表着当今商用信息安全产品的高端水平。表着当今商用信息安全产品的高端水平。这些这些安全设备除了提供必要的数据安全保障外,也安全设备除了提供必要的

60、数据安全保障外,也将适当开放部分设备用于信息安全技术研究和将适当开放部分设备用于信息安全技术研究和相关人才的培养。使用者可以利用浏览器查看相关人才的培养。使用者可以利用浏览器查看设备资料和功能界面,用以剖析、掌握、探讨设备资料和功能界面,用以剖析、掌握、探讨最新网络安全技术,探索信息安全漏洞和开展最新网络安全技术,探索信息安全漏洞和开展网络攻防策略研究。网络攻防策略研究。8. 8. 下一代互联网下一代互联网 目前目前IP V4 IP V4 作为网络的基础设施而广泛地作为网络的基础设施而广泛地应用在应用在InternetInternet上,它是一个令人难以置信上,它是一个令人难以置信的成功的协议

61、。但随着的成功的协议。但随着InternetInternet的高速发展,的高速发展,IP V4IP V4也面临着严重的危机,迫切地需要升级。也面临着严重的危机,迫切地需要升级。下一代互联网(下一代互联网(I Iv6v6)的变化主要体现在以)的变化主要体现在以下几个方面:下几个方面: (1) (1) 扩展地址:扩展地址:IPv6IPv6有比有比IPv4IPv4更长的地更长的地址,每个地址有址,每个地址有1616字节(字节(128128位),意味着位),意味着IPIP可以继续增长而无需考虑资源的匮乏,而其可以继续增长而无需考虑资源的匮乏,而其地址结构对于提高路由效率很有帮助。地址结构对于提高路由效

62、率很有帮助。 8. 8. 下一代互联网下一代互联网 (2)(2)简化简化IPIP报头格式:通过将报头格式:通过将Ipv4Ipv4中一些中一些必须的字段变为可选的,让中间路由器跳过必须的字段变为可选的,让中间路由器跳过这些选项,加速了路由器处理分组的速度,这些选项,加速了路由器处理分组的速度,有效地减轻路由瓶颈;有效地减轻路由瓶颈; (3)Ipv6(3)Ipv6在安全性和在安全性和QoSQoS控制方面有很大进控制方面有很大进步,身份验证和保密使得步,身份验证和保密使得IP V6IP V6更加适用于那更加适用于那些要求对敏感信息和资源特别对待的商业应些要求对敏感信息和资源特别对待的商业应用用。 当

63、然,当然,Ipv6Ipv6代替代替Ipv4Ipv4不是一朝一夕的事不是一朝一夕的事情,两者共存将是一个长期的过程情,两者共存将是一个长期的过程8. 8. 下一代互联网下一代互联网CERNETCERNET和各大运营商为配合和各大运营商为配合CNGICNGI的推广的推广而在主干带宽上的迅猛提速,更将使下一代而在主干带宽上的迅猛提速,更将使下一代互联网显示其特有的生命力开发基于互联网显示其特有的生命力开发基于NGINGI的的关键应用,提升互联网在各行业的作用将孕关键应用,提升互联网在各行业的作用将孕育巨大的软件产业,有必要进行前瞻性探讨。育巨大的软件产业,有必要进行前瞻性探讨。中心机房配置的双协议栈

64、路由器和交换机,中心机房配置的双协议栈路由器和交换机,除支撑日常运行外,尚可用于构造除支撑日常运行外,尚可用于构造IP v6IP v6小型小型实验网,有助于实验网,有助于NGINGI的应用开发研究的应用开发研究结束语结束语目前中心机房只是实现了硬件到位和目前中心机房只是实现了硬件到位和操作系统安装,结合初步开放配置了部分操作系统安装,结合初步开放配置了部分开发平台和工具软件,今后的路还很长,开发平台和工具软件,今后的路还很长,相信在三个学院教师、技术人员和研究生相信在三个学院教师、技术人员和研究生的共同努力下,中心机房一定能在科研和的共同努力下,中心机房一定能在科研和人才培养中发挥应有的作用。人才培养中发挥应有的作用。 请看演示,谢谢大家!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 幼儿/小学教育 > 幼儿教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号