在 Open MPI 4.0.3 中,如何在 CUDA 中实现称为 Ballot 的操作?
每个主机都知道一个 bool 值(无论是 GPU 还是 CPU 主机)。我需要在每个包含 a[i]==true
的主机上获取一个 bool 数组如果i
-th 主机是 GPU 主机。每个主机上的阵列必须相同。
语言是 C++(C 也很好),操作系统是 Ubuntu 20.04 。
最佳答案
你描述的听起来像 MPI_Allgather
https://www.mpich.org/static/docs/latest/www3/MPI_Allgather.html
关于c++ - MPI 中的投票操作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69949915/