如何在MPI_Comm_split之后分配句柄?

说,我有8个进程。 当我执行以下操作时,MPU_COMM_WORLD通信器将被分成两个通信器。 具有偶数id的进程将属于一个通信器,具有奇数id的进程将属于另一个通信器。

color=myid % 2; MPI_Comm_split(MPI_COMM_WORLD,color,myid,&NEW_COMM); MPI_Comm_rank( NEW_COMM, &new_id); 

我的问题是这两个传播者的手柄在哪里。 拆分之后,处理器的ID为0 1 2 3 4 5 6 7将变为0 2 4 6 | 1 3 5 7。

现在,我的问题是:假设我想在特定的通信器中发送和接收,比如托管偶数ID的那个,然后当我使用错误的通信器从0到2发送消息时,消息可能最终在第二个通信器中,它是否正确? 提前谢谢您的澄清!

 if(new_id < 2){ MPI_Send(&my_num, 1, MPI_INT, 2 + new_id, 0, NEW_COMM); MPI_Recv(&my_received, 1, MPI_INT, 2 + new_id, 0, NEW_COMM, MPI_STATUS_IGNORE); } else { MPI_Recv(&my_received, 1, MPI_INT, new_id - 2, 0, NEW_COMM, MPI_STATUS_IGNORE); MPI_Send(&my_num, 1, MPI_INT, new_id - 2 , 0, NEW_COMM); } 

完整代码

 #include  #include  #include  #include  int main(argc,argv) int argc; char *argv[]; { int myid, numprocs; int color,Zero_one,new_id,new_nodes; MPI_Comm NEW_COMM; MPI_Init(&argc,&argv); MPI_Comm_size(MPI_COMM_WORLD,&numprocs); MPI_Comm_rank(MPI_COMM_WORLD,&myid); int my_num, my_received; int old_id; switch(myid){ case 0: my_num = 0; old_id = 0; break; case 1: my_num = 1; old_id = 1; break; case 2: my_num = 2; old_id = 2; break; case 3: my_num = 3; old_id = 3; break; case 4: my_num = 4; old_id = 4; break; case 5: my_num = 5; old_id = 5; break; case 6: my_num = 6; old_id = 6; break; case 7: my_num = 7; old_id = 7; break; } color=myid % 2; MPI_Comm_split(MPI_COMM_WORLD,color,myid,&NEW_COMM); MPI_Comm_rank( NEW_COMM, &new_id); MPI_Comm_rank( NEW_COMM, &new_nodes); // 0 1 2 3 4 5 6 7 //After splits we have these nums for 8 processors // 2 3 0 1 6 7 4 5 //After the below exchange we should have this...each two elements in each communicator will exchange to next two elements in that same communicator if(new_id < 2){ MPI_Send(&my_num, 1, MPI_INT, 2 + new_id, 0, NEW_COMM); MPI_Recv(&my_received, 1, MPI_INT, 2 + new_id, 0, NEW_COMM, MPI_STATUS_IGNORE); } else { MPI_Recv(&my_received, 1, MPI_INT, new_id - 2, 0, NEW_COMM, MPI_STATUS_IGNORE); MPI_Send(&my_num, 1, MPI_INT, new_id - 2 , 0, NEW_COMM); } printf("old_id= %d received num= %d\n", old_id, my_received); MPI_Finalize(); } 

我已经编辑了你的问题,让它更清晰。 此外,我修复了与调用MPI_Comm_split创建的两个新通信器相关的ID。

第一个问题。 调用MPI_Comm_split之后的单个进程最多可以获得一个新创建的通信器的一个句柄(实际上,对于传递MPI_UNDEFINED作为颜色参数值的进程,返回的通信器实际上可能等于MPI_COMM_NULL)。 这就是为什么初学者通常不理解这个调用的语义的原因:MPI_Comm_split是一个集体调用,因此,它必须由原始通信器中的所有进程调用。 因此,每个进程调用一次,但该函数返回$ k $ communicators,具体取决于所有进程提供的颜色参数的值,将进程划分为$ k $ groups。 如果您对这种强大的机制不满意并且想要只创建一个通信器,那么只需在每个不必属于新创建的通信器的进程的调用中提供MPI_UNDEFINED作为颜色参数的值。 但是,您应该使用其他可用的function来创建通信器,而不是MPI_Comm_split。

第二个问题。 如果语义现在已经清除,您将立即认识到使用MPI_Comm_split为点对点或集体通信返回的通信器的进程永远不会与作为MPI_Comm_split返回的另一个通信器的一部分的进程交换数据。 传播者提供不同的传播者世界,因为每个传播者已经关联了不同的过程组。

现在,即使由属于偶数ids通信器的进程调用,您的代码段也不起作用。 为什么? 因为当new_id <2时执行的代码将从新通信器中具有等级0的进程正确地发送到新通信器中具有等级2的进程,并且新通信器中具有等级0的进程将从具有等级2的进程接收新的沟通者。 但是,else分支存在缺陷。 实际上,在新的通信器中具有偶数等于= 2的所有进程将执行它,而不仅仅是具有等级2的进程。在这种情况下,该分支将由新的偶数中的等级2,4和6的进程执行。 ids沟通者。 当然,具有等级4和6的进程将永远挂起,分别阻止进程2和4从未发送的消息。

最后,由于相同的代码也将由另一个新创建的通信器中具有奇数id的进程执行,因此具有等级1的进程将尝试从进程3发送和接收,并且在else分支中具有等级3,5和7也将尝试发送和接收。 在这种情况下,进程5和7将永久挂起,分别阻止进程3和5从未发送的消息。

如果要在级别为0和2的进程之间交换数据,则可以轻松修复代码。只需使用显式ids 0和2并重写if,如下所示:

 if(!new_id){ MPI_Send(&my_num, 1, MPI_INT, 2, 0, NEW_COMM); MPI_Recv(&my_received, 1, MPI_INT, 2 + new_id, 0, NEW_COMM, MPI_STATUS_IGNORE); } if(new_id == 2){ MPI_Recv(&my_received, 1, MPI_INT, 0, 0, NEW_COMM, MPI_STATUS_IGNORE); MPI_Send(&my_num, 1, MPI_INT, 0, 0, NEW_COMM); }