openMPI在服务器集群上运行期间无限期等待?

我已成功在服务器和计算机之间设置密码减去ssh。 有一个简单的openMPI程序在单台计算机上运行良好。 但是,不幸的是,当我在群集上尝试这个时,我都没有得到密码提示(因为我已经设置了ssh授权),也没有执行正在向前发展。

Hostfile看起来像这样,

# The Hostfile for Open MPI # The master node, 'slots=8' is used because it has 8 cores localhost slots=8 # The following slave nodes are single processor machines: gautam@pcys13.grm.polymtl.ca slots=8 gautam@srvgrm04 slots=160 

我在群集上运行hello world MPI程序,

 int main(int argc, char *argv[]) { int numprocs, rank, namelen; char processor_name[MPI_MAX_PROCESSOR_NAME]; double t; MPI_Init(&argc, &argv); t=MPI_Wtime(); MPI_Comm_size(MPI_COMM_WORLD, &numprocs); MPI_Comm_rank(MPI_COMM_WORLD, &rank); MPI_Get_processor_name(processor_name, &namelen); printf("Process %d on %s out of %d\n", rank, processor_name, numprocs); MPI_Finalize(); } 

我正在运行像这样的mpirun -np 16 --hostfile hostfile ./hello

使用-d选项时,日志是这样的,

 [gautam@pcys33:~/LTE/check ]% mpirun -np 16 --hostfile hostfile -d ./hello [pcys33.grm.polymtl.ca:02686] procdir: /tmp/openmpi-sessions-gautam@pcys33.grm.polymtl.ca_0/60067/0/0 [pcys33.grm.polymtl.ca:02686] jobdir: /tmp/openmpi-sessions-gautam@pcys33.grm.polymtl.ca_0/60067/0 [pcys33.grm.polymtl.ca:02686] top: openmpi-sessions-gautam@pcys33.grm.polymtl.ca_0 [pcys33.grm.polymtl.ca:02686] tmp: /tmp [srvgrm04:77812] procdir: /tmp/openmpi-sessions-gautam@srvgrm04_0/60067/0/1 [srvgrm04:77812] jobdir: /tmp/openmpi-sessions-gautam@srvgrm04_0/60067/0 [srvgrm04:77812] top: openmpi-sessions-gautam@srvgrm04_0 [srvgrm04:77812] tmp: /tmp 

你可以从日志中推断出来吗?

您只需要禁用每台计算机的防火墙