如何高效分配网格的设计方案

上传人:hs****ma 文档编号:563586268 上传时间:2022-08-28 格式:DOC 页数:5 大小:19KB
返回 下载 相关 举报
如何高效分配网格的设计方案_第1页
第1页 / 共5页
如何高效分配网格的设计方案_第2页
第2页 / 共5页
如何高效分配网格的设计方案_第3页
第3页 / 共5页
如何高效分配网格的设计方案_第4页
第4页 / 共5页
如何高效分配网格的设计方案_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《如何高效分配网格的设计方案》由会员分享,可在线阅读,更多相关《如何高效分配网格的设计方案(5页珍藏版)》请在金锄头文库上搜索。

1、如何高效分配网格资源的设计方案摘要:本文介绍了基于集群技术的作业管理系统pbs,重点研究了pbs系统的体系构造、工作原理。着重从系统各进程的运行机制、平安策略、调度策略和通信策略等方面进展阐述。并分析讨论了pbs与网格计算环境的交融,最后给出实现方案。关键词:网格资源,平安策略1引言网格是一个集成的计算与资源环境,充分吸收各种计算资源,并将它们转化成一种随处可得的、可靠的、标准的同时还是经济的计算才能。与传统的网络资源不同,网格资源具有异构性、动态性和自治性的特点。网格资源的这些特性给网格资源自身的管理带来了实现上的困难和不可控性。同时为了满足高性能计算的目的,必须提供高效的资源管理效劳。网格

2、系统的资源管理负责决定作业恳求pu效劳等待时间、作业的内存分配、以及怎样平衡计算负载等多方面的问题。资源管理同时负责在所有提交给系统的作业之间分配资源作业间资源管理以及把资源绑定给由一个单一作业提出的多个恳求作业内资源管理。假如没有作业间资源管理,资源将可能在用户间错误的分配,这对一些用户将失去公平性。糟糕的作业内资源管理将导致用户程序运行性能的下降,原因是程序恳求到的资源可能早已超负荷或者根本就恳求不到满足系统要求的资源。由于存在的以上问题,网格资源的管理在网格计算环境中处于一个很重要的地位,也是网格研究的主要研究课题之一。目前我们对于网格计算环境底层的资源,主要是通过采用作业管理系统进展管

3、理。2pbs作业管理系统分析pbsprtablebathsyste作业管理系统最初由nasa的aes研究中心开发,为了提供一个能满足异构计算网络需要的软件包,特别是满足高性能计算的需要。它力求提供对批处理的初始化和调度执行的控制,允许作业在不同主机间的路由。pbs的独立的调度模块允许系统管理员定义资源和每个作业可使用的数量。调度模块存有各个可用的排队作业、运行作业和系统资源使用状况信息。使用它提供的tl、bal、三种过程语言,调度策略可以很容易被修改,以适应不同的计算需要和目的,即系统管理员可以方便地实现自己的调度策略。对于pbs作业管理系统来说,它主要有以下特征:易用性:为所有的资源提供统一

4、的接口,易于配置以满足不同系统的需求,灵敏的作业调度器允许不同系统采用自己的调度策略。移植性:符合psix1003.2标准,可以用于shell和批处理等各种环境。适配性:可以适配各种管理策略,并提供可扩展的认证和平安模型。支持广域网上的负载的动态分发和建立在多个物理位置不同的实体上的虚拟组织。灵敏性:支持交互和批处理作业。一个pbs作业管理系统主要有4个局部组成:控制台、效劳进程、调度进程、执行进程。pbs的工作过程实际上就是效劳进程、调度进程、执行进程这三个进程之间,互相通信互相调用的过程。三个进程分别执行各自的职能,同时为其他进程提供效劳,共同完成作业的运行。在pbs工作过程中,首先由用户

5、产惹事件这里指作业的提交,事件通知效劳进程开场一个调度周期。然后效劳器进程发送一个调度命令给作业调度进程,调度进程开场启动调度工作。在收到效劳器进程的调度命令后,作业调度进程向执行进程恳求可利用的资源信息。执行进程根据本地资源信息返回给作业调度器一个资源信息。其后,得到资源信息后,调度进程向效劳器进程恳求作业信息。效劳器进程接收恳求,并发送作业信息至作业调度进程,调度进程产生执行作业的策略。作业调度器发送执行作业恳求至效劳进程。最后,效劳器进程接收恳求后,发送作业至执行进程执行作业。3pbs与网格环境结合网格计算环境为用户提供了强大的计算资源,将pbs融入到网格的计算环境中可以使pbs访问到更

6、多的计算资源,使pbs的资源提供才能得到很大的增强,使用户可以调用不同的管理域的资源如同使用本地资源一样。同时pbs融入到网格计算环境也扩展了网格计算环境自身的计算资源。下面以pbs与目前全球重要的网格计算工程glbus之间的结合,介绍它们之间资源调度、数据传输、平安认证等方面的解决方案。glbus工程是美国argnne国家实验室等科研单位的研发工程,发起于20世纪90年代中期。glbus工程是目前全球重要的网格计算工程之一,其最初的目的是希望把美国境内的各个高性能计算中心通过高性能网络连接起来,方便美国的大学和研究机构使用,进步高性能计算机的使用效率。pbs与glbus的结合,主要目的是可以

7、到达彼此计算资源的互相调用,pbs对glbus资源调用的实现,可以为用户提供访问网格计算资源建立一个门户。用户通过提交作业,可以像调用pbs资源一样调用远端的不同管理域下的资源。glbus那么负责提供与底层不同资源管理者的接口,以及相应的数据传输、平安认证、资源调度等策略。glbus对pbs资源调用的实现,那么扩展了网格计算环境下底层的计算资源。通过结合,目的是实现网格计算环境的根本模型。当pbs调用glbus资源时,首先需要解决的是资源的发现,pbs要对glbus资源进展调度使用,那么在提交的作业当中必须对作业的可用资源说明进展描绘,使其可以寻找到glbus的资源,并加以利用。为了到达资源指

8、定的目的,在作业资源需求描绘中我们参加特定的参数“-lsite=glbus:resurenae。这个参数仅仅是标记了作业对资源需求的期望,并未分配glbus资源。其次需要提供一个资源恳求信息的接收端口,申请得到glbus资源的作业会像正常的pbs提交作业一样,将自己的资源恳求发送到pbs效劳器上等待效劳进程的处理,之后调度进程会根据作业的资源恳求将作业传送到与它资源匹配的执行节点,并由各节点的执行进程运行。为了提供一个专门的接收glbus资源恳求的端口,在启动效劳进程的同时要启动一个pbs_glbus进程。当调度器发现了作业特定的glbus资源恳求,直接将作业发送到pbs_glbus进程进展处

9、理。为了可以利用glbus资源,pbs作业必须以glbus作业的形式进入到glbus进展资源的利用,通过pbs_glbus进程将作业中pbs的参数全部映射成glbusrsl的形式。在整个资源调度的过程中,pbs实际充当了网格计算环境的入口点,通过提交pbs作业可以实现对网格计算资源的调用,用户可以像使用本地资源一样去使用远端不同资源管理者下的资源。而glbus作为一种中间件,由它来负责规划网络间通信的平安协议,并实现对不同的远端资源管理者的通信接口。此外,pbs通过文件stagein和stageut配合glbus的gass效劳来进展数据的传输,可以解决pbs与glbus数据传输的问题。全局二级

10、存储效劳gassglbalaesstsendarystrage主要用来支持网格环境下的远程i/问题,并针对网格计算环境中的文件访问形式进展了优化支持。当glbus调用pbs资源时,相对pbs对glbus资源的调用要简单一些。glubs在本地提交glbus作业时,通过在命令行参数中添加pbs效劳器的名称及途径来指定需要调用的pbs资源,并在命令结尾添加jbanager-pbs参数开启glubsy与pbs之间的端口。glbus提交作业的恳求被送到gra,gatekeeper判断作业需要调用的资源,并根据rsl描绘解析出的任务分配参数传递给新创立的任务管理者。任务管理者接到需要调用pbs资源的恳求,

11、那么将作业资源信息的描绘发送到jbanager-pbs端口,jbanager-pbs端口会产生一个新的用pbs脚本语言描绘资源信息的作业脚本。任务管理者将这个脚本发往pbs效劳器进展执行。4pbs系统测试与分析硬件环境的配置方面,首先要选择一组合适实验过程的主机搭建实验环境。出于对实验稳定性与兼容性的考虑,我们选取了8台硬件与软件配置完全一样的主机,硬件配置为:pup400hz内存128sdra;操作系统为:linux9.0。这样便于对pbs系统整体性能测试。其次对于主机间的通信,为了提供一个快速稳定的网络环境,我们采用以太网的技术用5类双绞线和一台百兆交换机将这8台机器组成一个小型局域网环境

12、,并进展了相应的网络设置。软件环境的配置主要是对pbs系统的安装和配置,主要包括:系统安装、效劳器配置、执行节点配置、进程启动、建立作业队列、实验的内容是提交一个矩阵相乘的并行作业,矩阵运算在科学与工程计算中是最根本的核心问题之一,用它来进展测试具有代表性。本作业要完成a、b两个1000*1000矩阵相乘目的是为了对搭建的pbs系统环境进展测试,检验pbs系统的正确运转及相关性能的测试,并对实验结果进展分析。首先采用并行行列划分算法,通过pi编写实现矩阵相乘的并行程序pjb.程序代码见附录。并在linux下用pipjb.进展编译,生成a.ut执行文件,将参与运算的矩阵文件a.dat、b.dat

13、拷贝到本地。并在单机下直接运行命令./ut,记录运行产生的结果。然后,编写作业提交脚本文件,在脚本中对作业进展资源需求的描绘。之后,运行命令qsubparallel_jb向pbs效劳器提交作业,通过监控命令qstat可以看到作业已经分配到执行队列中处于执行状态,并且效劳器分别将并行作业的子进程传输到各台执行节点上运行,8台执行节点都处于运行状态。各节点的并行程序的子进程运行完毕后,在标准输出文件中产生运算结果,记录运行时间。再逐步减少执行节点的数目继续实验,直到只剩下单机运行,记录单机运行产生的结果及运行时间。通过测试,获得了作业运行时间与节点数关系图。当增加执行节点的个数作业的执行才能有明显

14、的进步呈现出反比关系的曲线。为了进一步的分析,还可以在节点数不变的情况下,再选取一组512*512的矩阵进展运算,运算过程同1000*1000矩阵相乘一样。最后根据记录的运行结果显示,在不同数目的执行节点上运行的作业结果以及非pbs系统上运行作业的结果完全一样。验证pbs系统整体可以正常的运做。fig.3nnetinbetenjbtieandnde5完毕语本文提出了一种合适集群环境下的高效资源分配与利用方案,并给出了详细的设计过程。深化分析了pbs系统的内部运行机制、平安机制、调度策略等方面问题,提出了改良方案。研究pbs系统与网格计算环境的交融问题,并将pbs集群计算环境融入到了网格计算环境,将pbs系统作为网格计算环境的低层资源,并通过glbus对pbs系统进展了作业提交,测试了pbs在glbus下的正常运转。【参考文献】1都志辉.网格计算北京:清华大学出版社,2002:10.2郑纬民等译.高性能集群计算构造与系统第一卷,北京:电子工业出版社,2001:6.3pbs用户手册:?pbsadinistratrguide?s2000:4.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号