Ubuntu安装MPICH3集群计算环境
本文是在Ubuntu15.10麒麟版中安装过程的实录。
准备工作:
1.设置root用户密码(命令:sudo passwd root)
2.正确设置各个节点IP(各个节点应该使用静态IP)
3.正确设置各个Host名字(sudo gedit /etc/hostname,同时要修改/etc/hosts内容使得Host名字保持一致)
4.安装OpenSSH软件(sudo apt-get install openssh-server)
注意点:
安装过程中,如果修改了一些参数,有时需要删除~/.ssh/known_hosts文件,然后重新用ssh命令连接到其他节点机器上。
MPICH官网是http://www.mpich.org/(点击进入,下同)。
setp1:下载软件
软件下载地址是:http://www.mpich.org/downloads/。如下图所示:
点击上图中mpich-3.2相关的"http"链接,即可下载软件。下载的软件文件名是“mpich-3.2.tar.gz”。
step2.解压缩软件
可以用提取菜单功能进行提取,也可以使用以下命令解压缩:
tar -xzvf soft/mpich-3.2.tar.gz
解压缩后得到目录“mpich-3.2”。
step3.软件安装
运行以下命令进行安装(将软件安装在/usr/local/mpich目录下):
cd mpich-3.2
./configure --prefix=/usr/local/mpich
对于上述命令,如果没有安装Fortran语言编译器,则需要给该命令增加选项,屏蔽Fortran语言支持,否则会出现错误。可以运行以下命令:
./configure --prefix=/usr/local/mpich --disable-fortran
然后,运行以下命令:
make
make install
step4.环境变量设置
运行以下命令,编辑文件“/etc/profile”中的环境变量:
sudo gedit /etc/profile
在该文件的最后,添加以下的行:
PATH=$PATH:/usr/local/mpich/bin
MANPATH=$MANPATH:/usr/local/mpich/man
export PATH MANPATH
step5.单节点测试
运行以下命令(将本地目录下程序拷贝到安装软件的位置):
cp -r examples/ /usr/local/mpich
运行测试,运行以下命令:
mpiexec -n 10 /usr/local/mpich/examples/cpi
step6.其他测试
可以运行以下命令进行测试,检查MPICH是否正确安装。
which mpicc
which mpiexec
step7.集群机器免密码登录设置
事先需要安装OpenSSH软件,运行以下命令:
sudo apt-get install openssh-server
同时需要启动ssh服务,运行以下命令:
/etc/init.d/ssh start
接着进行ssh配置。运行以下命令:
ssh-keygen -t dsa
需要输入3次Enter,生成的文件在~/.ssh目录下。
然后,使用以下命令,将文件id_rsa.pub拷贝到authorized_keys(在~/.ssh目录下运行以下命令):
cat
id_rsa.pub authorized_keys
同时,需要把这两个文件(id_rsa.pub和authorized_keys)拷贝到各个节点的~/.ssh目录下。
step8.ssh登录测试
可以输入以下命令,登录到其他机器中:
ssh m1
这里,m1是集群节点的某个机器IP名字,m1也可以是IP。
各个集群节点也需要安装MPICH软件,同时配置做step7的配置(将文件id_rsa.pub和authorized_keys拷贝到各个节点的~/.ssh目录下。)
step10.多机集群计算测试
通常在~(主目录)目录下,创建machinefile(该文件名可以是其他名字,也可以是这个名字),其内容如下:
m1:4
m2:4
m3:4
m4:4
这里,m1-m4为各个节点的IP值,冒号后面的是节点的线程数。然后,运行以下命令,进行集群计算测试:
mpiexec -n 10 -machinefile ./machinefile /usr/local/mpich/examples/cpi
至此,MPICH集群计算环境安装设置完成。