《linux集群系统就建成》由会员分享,可在线阅读,更多相关《linux集群系统就建成(5页珍藏版)》请在金锄头文库上搜索。
1、说明:本系统测试环境为 Redhat9.0完全安装,并且以获得 mpich2-1.0.1.tar.gz软件包。假设你的 mpich2-1.0.1.tar.gz软件包已经下载到/root/目录下。以 root用户登录。要求会使用 vi文本编辑器修改文件。下面以四台 pc为例。准备工作:设置 IP,更改主机名为 node01,node02,node03,node04.一、创建 SSH信任连接(在 root目录下)1、更改/etc/hosts 文件#vi /etc/hosts 打开 hosts文件,更改如下:127.0.0.1 localhost.localdomain localhostnode0
2、1的 IP scc-mnode01的 IP node01node02的 IP node02node03的 IP node03node04的 IP node042、在 node01生成 SSH秘钥对.#ssh-keygen -t rsa 一路回车即可产生.ssh 文件,#ls -a 查看是否有.ssh 文件夹3、进入.ssh 目录#cd .ssh4、生成 authorized_keys文件#cp id_rsa.pub authorized_keys 5、退出到 root目录#cd .6、建立本身的信任连接#ssh node01 按提示输入 yes(三个字母要打全)7、设置 node02(node
3、02 的 root目录下)#ssh-keygen -t rsa 生成.ssh 文件夹#scp node01的 IP:/root/.ssh/* /root/.ssh 拷贝 node01上的.ssh 文件夹覆盖本地的#scp node01的 IP:/etc/hosts /etc/hosts 拷贝 node01上的 hosts文件覆盖本地的#ssh node01 提示处输入 yes回车设置 node03,node04的方法与 node02相同8、确认四台机器的信任连接已建立对每个节点执行:#ssh node01#ssh node02#ssh node03#ssh node04在提示处输入 yes回车
4、,最后确定无需输入密码并且没有任何提示信息即可登陆(Last login:时间日期提示信息除外)二、安装 MPICH2(在节点 root目录下)1、解压缩#tar -zxvf mpich2-1.0.1.tar.gz或者 #gunzip -c mpich2-1.0.1.tar.gz|tar xf mpich2-1.0.1.tar2、创建安装目录#mkdir /usr/MPICH-instsll3、进入 mpich2解压目录#cd mpich2-1.0.14、设置安装目录#./configure -prefix=/usr/MPICH-install5、编译#make6、安装#make instal
5、l7、退出到 root目录#cd .8、通过编辑.bashrc 文件修改环境变量#vi .bashrc修改后的.bashrc 文件如下:# .bashrc# User specific aliases and functions alias rm=rm -ialias cp=cp -ialias mv=mv -iPATH=$PATH:/usr/MPICH-install/bin 新增加的#Source global definitionsif -f /etc/bashrc ; then. /etc/bashrcfi9、测试环境变量设置#which mpd#which mpicc#which m
6、piexec#which mpirun10、修改/etc/mpd.conf 文件,内容为 secretword=myword#vi /etc/mpd.conf设置文件读取权限和修改时间#touch /etc/mpd.conf#chmod 600 /etc/mpd.conf11、创建主机名称集合文件/root/mpd.hosts#vi mpd.hosts文件内容如下:node01node02node03node04三、测试1、本地测试#mpd & 启动 #mpdtrace 观看启动机器#mpdallexit 退出2、通过 mpd.hosts运行集群系统#mpdboot -n number -f
7、mpd.hosts number为要起动的机器个数#mpdtrace #mpdallexit3、测试运行 MPICH的例子程序#mpdboot -n 4 -f mpd.hosts 启动 4台机器#mpiexec -n number /usr/MPICH-install/examples/cpi number为使用的进程数#mpdallexit4、如果测试不能通过,请进行第四步四、问题解决1、通过 mpdcheck获得一写帮助信息#mpdcheck -pc2、查错#mpdcheck -l3、通过 mpd.hosts文件查错#mpdcheck -f mpd.hosts 如果无错误#mpdcheck -f mpd.hosts -ssh4、如果上述无错误,可略过此步对任意两台机器进行查错m1: #mpdcheck -s 输出主机名 host和端口 portm2: #mpdcheck -c host port 注意:以上四步都是在没有运行 mpd的情况下进行的5、mpd 查错m1: #mpd -e & 返回使用的端口m2: #mpd -h m1 -p echoed_port_m1 &以上测试通过,集群系统就建成了