非阻塞点对点通信中发送模式对MPI开销的影响

我想确定MPI中非阻塞点对点通信的开销。 有一些基准可用(如Sandia MPI Micro-Benchmark Suite或OSU微基准测试 ),但由于某些原因,他们不区分MPI提供的发送模式(标准,就绪,缓冲,同步)和仅使用标准模式。 MPI报告指出

在此模式下,由MPI决定是否缓冲传出消息。 MPI可以缓冲传出消息。 在这种情况下,发送调用可以在调用匹配的接收之前完成。 另一方面,出于性能原因,缓冲区空间可能不可用,或者MPI可能选择不缓冲传出消息。 在这种情况下,发送呼叫将不会完成,直到匹配的接收已发布,并且数据已移至接收方。

我认为将消息写入缓冲区可能与将消息直接发送到接收器(可能物理上很远,通过低带宽连接等连接)具有不同的性能。 所以我的问题是,我的假设是否是错误的,缓冲发送和就绪发送之间从来没有任何显着的性能差异(如果是,为什么) – 或者这些基准是否只是忽略了这些可能的差异(如果是,为什么) 。

您的理解是正确的,缓冲和非缓冲发送的性能可能不同。 如果调用MPI_Send ,MPI实现可以根据消息大小,系统体系结构,网络速度和许多其他变量选择使用哪种机制。 通常,缓冲发送用于小消息,同步发送用于大消息。

建议 MPI应用程序开发人员坚持使用MPI_Send并依靠MPI实现来提供最佳性能。 因此,大多数MPI基准测试也会报告MPI_Send的性能,而不是其他常用的模式。