c++ - 使用 mpirun/mpiexec 运行时检测不使用 MPI

标签 c++ c c++11 mpi

我正在编写一个程序(在 C++11 中),可以选择使用 MPI 并行运行。该项目使用 CMake 进行配置,如果找不到 MPI,CMake 会自动禁用 MPI 并显示相关警告消息。

但是,我担心一个非常合理的用例,即用户在 HPC 集群上配置和编译程序,忘记加载 MPI 模块,并且没有注意到警告。然后同一用户可能会尝试运行该程序,注意未找到 mpirun,包括 MPI 模块,但忘记重新编译。如果用户随后使用 mpirun 运行该程序,这将起作用,但该程序将只运行多次而没有任何并行化,因为 MPI 在编译时被禁用。为了防止用户认为程序是并行运行的,我想让程序在这种情况下显示一条错误消息。

我的问题是:如何在不使用 MPI 库函数的情况下检测到我的程序正在并行运行(因为 MPI 在编译时被禁用)?据我所知,mpirun 只是多次启动程序,但不会告诉它启动的进程它们是并行运行的。

我想过让程序写一些测试文件,然后检查该文件是否已经存在,但除了由于并发问题这可能很棘手之外,不能保证 mpirun 甚至会在共享文件系统的节点上启动各种进程。

我也考虑过使用系统变量在两个进程之间进行通信,但据我所知,没有系统独立的方式来做到这一点(而且,这可能会导致并发问题,因为没有办法协调各个进程之间的系统调用)。

所以目前,我的想法已经用完了,我非常感谢任何可能帮助我实现这一目标的建议。首选的解决方案应该独立于操作系统,尽管仅 UNIX 的解决方案已经很有帮助。

最佳答案

基本上,您想在非 MPI 代码路径中检测是否正在由 mpirun 等运行。有一个非常相似的问题:How can my program detect, whether it was launch via mpirun已经提出了一种非可移植解决方案。

Check for environment variables that are set by mpirun. See e.g.: http://www.open-mpi.org/faq/?category=running#mpi-environmental-variables

作为另一种选择,您可以获得 process id of the parent process它是 process name并将其与已知 MPI 启动器二进制文件列表进行比较,例如 orted,slurmstepd,hydra??1。不幸的是,关于那一切的一切都是不可移植的。

由于启动本身没有被 MPI 标准明确定义,因此没有标准的方法来检测它。

1:仅凭内存,请勿照字面理解。


从用户体验的角度来看,我认为始终显示一个清晰的消息程序是如何运行的,例如:

Running FancySimulator serially. If you see this as part of mpirun, rebuild FancySimuilator with FANCYSIM_MPI=True.

Running FancySimulator in parallel with 120 MPI processes.

会“解决”问题。收到 120 条乱码消息的用户有望注意到。

关于c++ - 使用 mpirun/mpiexec 运行时检测不使用 MPI,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41899821/

相关文章:

c - 为什么这个矩阵初始化为 2x4 而不是 2x2?

c++ - double *vec 和 double vec[] 的区别

c++ - 是否有 "safe"static_cast 替代方案?

c++ - 在 C++11/C++14 中的类中存储对象类型的列表/映射

c++ - 在 C++ 中初始化静态常量数组的特定元素

c++ - Typedef 泛化

C++ 初始化列表和默认值

c++ - 如何通过在 Qt 中按 esc 退出无限 while 循环?

c - fgets()会移动文件指针吗?

c++ - 指向非静态数据成员的指针在 VS2015 Update 2 中不正确