高性能集群并行环境安装与配置

上传人:公**** 文档编号:560259962 上传时间:2023-06-19 格式:DOCX 页数:28 大小:213.57KB
返回 下载 相关 举报
高性能集群并行环境安装与配置_第1页
第1页 / 共28页
高性能集群并行环境安装与配置_第2页
第2页 / 共28页
高性能集群并行环境安装与配置_第3页
第3页 / 共28页
高性能集群并行环境安装与配置_第4页
第4页 / 共28页
高性能集群并行环境安装与配置_第5页
第5页 / 共28页
点击查看更多>>
资源描述

《高性能集群并行环境安装与配置》由会员分享,可在线阅读,更多相关《高性能集群并行环境安装与配置(28页珍藏版)》请在金锄头文库上搜索。

1、并行环境安装与调试r1redhjRed HatEnterpriseLinux 4本文讲解的是基于Red Hat Enterprise Linux 4为平台的高性能计算集群安装 与调试,假设你使用过Red Hat Enterprise Linux 4并且理解了高性能计算的 原理,所以本文稿的重点讲解如何安装与调试,关于高性能计算的原理请自行 查阅相关的资料。你可以拒绝学习但你的竞争对手不会杰克.韦尔奇QQ: 11217404MAIL: 前言LINUX 集群中的每个节点都有自己的处理器和内存,运行独立的操作系统,不能直接访 问其他节点的处理器,内存或其他设备。而 MPI 环境却要求这样的访问,这就

2、需要内部网络 和协议的支持。首先,每个节点要能互访,需进行基本网络配置;其次,由于并行计算的特 点,每个节点的计算程序是通常是相同的,只是所分配的计算区间不同。这就需要:(1)高 效率的用户身份验证方法,并且能执行用户发出的计算指令。(2)每个计算节点能够使用载 入同一个计算程序,并能进行相应初始化。对于第一个要求,可通过网络信息服务(NIS)和 SHELL命令服务(RSH、SSH)实现。对于第二个要求,可以使用Linux的NFS文件系统实现, 将服务器节点的用户文件让所有计算共享。所以NIS、NFS、RSH、SSH是集群的基本网络服务。1网络信息服务NIS)NIS是一个简单的客户机/服务器数

3、据库系统,提供一个简易网络查询服务。NIS是网络 信息系统的简称,包含了网络用户的信息,由数据库与处理程序构成,目的是为网络上所有 机器提供所需信息。数据库建立在服务器上,用于统一管理集群中服务器和节点机的用户信 息,使得一个用户可以登入集群中任何一台节点机,而不需要管理员另外为用户在每台节点 机上设置用户和密码。虽然NIS存在一定的安全隐患,但在内部网络,安全问题不大。2远程 SHELL 命令(RSH、SSH)基于 MPI 的并行计算需要在每个计算节点启动并行计算任务,用户需要登入每个节点, 然后递交计算任务。不过这通常效率比较低,那么,高效的做法是,不需要登入远程机器, 就可以在远程机器上

4、启动并递交计算任务,而RSH与SSH提供了这样的机制。MPI安装于服 务器节点,其启动命令包含有在每个可供使用的节点机上启动计算的批处理命令。 NIS 为节 点机接受这样的命令提供身份验证机制,但是,远程 SHELL 命令需要由程序来发出和响应。 RSH与SSH就是这样的程序。命令执行之前,节点机检查服务器是否有权限发出这样的命令。 之后,节点机通过/etc/hosts.equiv文件对服务器IP做可信赖检查,通过检查,就命令执 行;没通过,则需口令才能执行命令。对于集群来说,做的是高效率的并行计算,无口令登 入,无疑带来了更高的计算效率。3 网络文件系统(NFS)并行任务启动时,需要所有节点

5、都能载入并行计算程序的执行代码。并行计算程序执行 代码文件、输入输出数据文件等必须让所有节点机共享,这可以通过NFS实现,用户在任何 节点登入,看到的是单一系统印象,感觉不到多台计算机的存在。微机集群一般通过NFS来 实现文件共享。 NFS 是一个可靠的协议,提供服务过程中不保留信息,客户机出现问题,并 不影响服务器。虽然NFS也存在比较大的安全隐患,但在内部网络,问题就不明显了。4MPICH 并行环境MPICH是Linux平台下最重要的一种MPI实现,是一个与MPI规范同步发展的版本。每 当MPI标准推出新的版本时,MPICH就会有相应的实现版本。MPICH是一个MPI的库,它提供 了不同版

6、本MPI的库结构,编程人员可以使用MPICH来使用这些MPI接口,以便写出适合自 己的基于消息传递的并行程序。编程人员使用C或者是Fortran语言来调用这些标准库,实 现程序的并行性。MPICH使用的是MPI标准,所以它开发的程序可移植性很强,而且它提供 统一的编程接口,所以程序的可开发性很强。本次测试就是MPICH的基础实现的,所以我们 将介绍如何的安装和使用MPICH具体安装步骤如下(以两节点集群为例):集群中各节点所安装的系统为Red Hat Enterprise Linux 4 U3 32bit,在安装操作系统时, 预安装所有软件包,以免以后用到的软件在重新安装带来的麻烦,在安装服务

7、器和节点机操 作系统时,设置服务器和节点机的主机名分别为:nodel,node2;其中node 1充当服务器兼管 理节点和I/O节点,node2充当计算节点。node 1 的 IP 为:eth0:192.168.0.1 eth1:172.16.0.1node2 的 IP 为:eth0:192.168.0.2 eth1:172.16.0.2配置完成后,可以用机群部署系统软件(曙光DCIS)把node2的系统镜像分发到其它计算节 点上。NIS配置在一个大型的网域当中,如果有多部 Linux 主机时,万一要每部主机都设定相同的账号 与密码的设定,还真是啰唆。所以,适时的使用一部主要主机 ( mast

8、er server )管理网域 中的所有账号,其它的主机则使用这部主要主机提供的账号与密码来达成让使用者登入 的作用即可!这样的功能有很多的服务器软件可以达成,这里我们要介绍的则是 Network Information Services, NIS server 这个服务器软件!NIS服务器具体配置1安装NIS服务默认配置安装的RedHat,其安装程序会将NIS服务安装在系统上,在RedHat中我们只需使 用下面的命令检查系统是否已经安装了 NIS服务:rootnode1 # rpm -qa |grep yp如果系统显示有如下软件包,表示NIS服务已经正确安装yp-tools-2.8-1yps

9、erv-2.8-1 ypbind-1.12-1否则表示还没有安装NIS服务,在RedHat AS 4的第1张与第2张安装光盘的/RedHat/RPMS 目录有 NIS 服务器的 RPM 安装包,该安装包的文件名分别为 ypserv-2.13-9.i386.rpm, yp-tools-2.8-7.i386.rpm, ypbind-1.17.2-8.i386.rpm 。放入光盘然后进行装载,并使用 下面的命令安装:rootnode1 # mount -t iso9660 /dev/cdrom /mnt/cdromrootnode1 # rpm -ivh /mnt/cdrom/RedHat/RPMS

10、/ypserv-2.13-9.i386.rpm rootnode1 # rpm -ivh /mnt/cdrom/RedHat/RPMS/yp-tools-2.8-7.i386.rpmrootnode1 # rpm -ivh /mnt/cdrom/RedHat/RPMS/ypbind-1.17.2-8.i386.rpm 注意:要提供NIS服务,必须安装portmap服务,并且portmap服务是运行的,查看是否安 装与安装方法同上,RedHat默认会安装portmap服务。2配置NIS服务(1) 启动 portmap 并设定开机时启动:rootnode1 # service portmap st

11、art rootnode1 # chkconfig -level 35 portmap on(2) 启动 time 与 time-udprootnode1 # vi /etc/xinetd.d/time#将 disable = yes 改成 disable = no 即可!rootnode1 # vi /etc/xinetd.d/time-udp# 同样的将 disable = yes 改成 disable = no 即可rootnode1 # service xinetd restartrootnode1 # chkconfig -level 35 xinetd onrootnode1 #

12、netstat -utlActive Internet connections (only servers)ProtoRecv-QSend-QLocalAddressAddressStatetcp*:time*:*LISTENtcpForeign00*:sunrpc*:*LISTENudp0 *:timeudp0 *:sunrpc*:*:*目前至少也要有上面四个 LISTEN 的 port 才行喔!分别是 UDP 与 TCP 封包的啦!(3) 建立 NIS 的领域名称 ( nisdomainname ) 建立 NIS 的领域名称 (我这里是设定为 cluster )rootnode1 # ni

13、sdomainname clusterrootnode1 # vi /etc/rc.d/rc.local#将底下这一行加入这个档案的最后一行:/bin/nisdomainname cluster设定好网络参数:rootnode1 # vi /etc/sysconfig/network#加入底下这一行:NISDOMAIN=cluster(3)建立网络信任群组:rootnode1 # touch /etc/netgroup(4) 启动ypserv与yppasswdd,并且设定开机时启动:rootnode1 # service ypserv startrootnode1 # service yppa

14、sswdd startrootnode1 # chkconfig -level 35 ypserv on rootnode1 # chkconfig -level 35 yppasswdd on(5) 制作数据库、并重新启动 ypserv 与 yppasswd :rootnode1 #/usr/lib/yp/ypinit -mAt this point, we have to construct a list of the hosts which will run NIS servers. server.cluster is in the list of NIS server hosts. P

15、lease continue to addthe names for the other hosts, one per line. When you are done with the list, type a .next host to add: node1next host to add:二二在这里按下ctrl + d跳出The current list of NIS servers looks like this:node1Is this correct? y/n: y yWe need a few minutes to build the databases.Building /var/yp/cluster/ypservers.Running /var/yp/Makefile.gmake1: Entering directory /var/yp/clusterUpdating passwd.byname.Updating passwd.by

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号