c - MPI 发送和接收死锁

标签 c mpi

我是 MPI 的新手,我只是在编写一个基本的发送和接收模块,我在其中将 12 个月发送给 n 个处理器并接收每个月并打印其值。所以我能够正确发送值并且也能够接收所有值但是我的程序卡住了,即它最后没有打印“程序完成后”。你能帮忙吗?

#include <stdio.h>
#include <string.h>
#include "mpi.h"
#include<math.h>

int main(int argc, char* argv[]){
int  my_rank; /* rank of process */
int  p;       /* number of processes */

int tag=0;    /* tag for messages */

MPI_Status status ;   /* return status for receive */
int i;
int pro;
/* start up MPI */

MPI_Init(&argc, &argv);

// find out process rank
MPI_Comm_rank(MPI_COMM_WORLD, &my_rank); 

//find out number of processes
MPI_Comm_size(MPI_COMM_WORLD, &p); 
if (my_rank==0)
{
    for(i=1;i<=12;i++)
    {
        pro = (i-1)%p;
        MPI_Send(&i, 1, MPI_INT,pro, tag, MPI_COMM_WORLD);
        printf("Value of Processor is %d Month %d\n",pro,i);
    }
}

//else{
for(int n=0;n<=p;n++)
{

    MPI_Recv(&i, 1, MPI_INT, 0, tag, MPI_COMM_WORLD, &status);
    printf("My Month is %d and rank is %d\n",i,my_rank);

}
//}
MPI_Barrier(MPI_COMM_WORLD);
if(my_rank==0)
{
    printf("After program is complete\n");
}
/* shut down MPI */

MPI_Finalize(); 
return 0;
}

Below is the output:
Value of Processor is 0 Month 1
Value of Processor is 1 Month 2
Value of Processor is 2 Month 3
Value of Processor is 3 Month 4
Value of Processor is 4 Month 5
Value of Processor is 0 Month 6
Value of Processor is 1 Month 7
Value of Processor is 2 Month 8
Value of Processor is 3 Month 9
Value of Processor is 4 Month 10
Value of Processor is 0 Month 11
My Month is 2 and rank is 1
My Month is 7 and rank is 1
My Month is 3 and rank is 2
My Month is 8 and rank is 2
Value of Processor is 1 Month 12
My Month is 1 and rank is 0
My Month is 6 and rank is 0
My Month is 11 and rank is 0
My Month is 12 and rank is 1
My Month is 4 and rank is 3
My Month is 9 and rank is 3
My Month is 5 and rank is 4
My Month is 10 and rank is 4

最佳答案

第一:您违反了 MPI 的基本规则之一,您必须将一个发送与一个接收相匹配。

在您的示例运行中,您使用 5 个处理器(等级)运行,如您所见,等级 0 向等级 0 发送 3 条消息,向其余等级发送 1 和 2 条消息。但是,每个级别的职位有13个接收。所以他们自然会陷入等待从未发送的消息。请记住,围绕 MPI_Recv 循环的代码被各级执行。所以总共会有 5 * 13 次接收。

如果轮到接收,您可以通过在循环内过滤来解决这个问题。但这取决于您是否真的事先知道等级 0 将发送多少消息 - 您可能需要更复杂的机制。

第二:您排名 0 向自己发送阻塞消息(没有先发布非阻塞接收)。这已经可能导致僵局。请记住 MPI_Send永远不会保证在匹配的接收被发布之前返回,即使它有时在实践中可能会。

第三:那个循环 for(int n=0;n<=p;n++)运行 13 次。你肯定不想要那个,即使你运行 12 次它是不正确的。

最后:对于特定示例,首选解决方案是将月份保存在数组中并使用 MPI_Scatterv 将其分布在所有进程中.

关于c - MPI 发送和接收死锁,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35754224/

相关文章:

将共享库编译成程序?

带有对 mpirun 的嵌入式调用的 Python

fortran - MPI 状态 FORTRAN

c++ - PMPI 和 otf2 : linking C code in CPP program

c - 创建打印数据后输出函数为空

python - 从 C 访问 Numpy 矩阵作为 3D 数组

c++ - 使用 Boost::Test 并行代码

multithreading - 在线程构建 block 中进行调试

c - Vugen - 将图像文件从一个文件夹复制到共享目录 - 仅限 C 代码

c - OS X getsockopt : no SO_PROTOCOL