场景:我有一个程序可以使用 OpenMP 轻松并行化,假设程序的主循环是一个 for 循环和其中的独立数据,因此并行化它是微不足道的。但是目前我不将其并行化,而是使用关联调度。
此程序对由命令行参数中的文件夹指定的一些输入文件执行工作。要并行运行这个程序,可以像这样创建一个 bat 文件:
start \affinity 1 "1" bat1
start \affinity 2 "2" bat2
start \affinity 3 "3" bat3
start \affinity 4 "4" bat4
其中 bat1 - 4 是一个 bat 文件,它调用 main.exe
,每个 bat 文件都有不同的输入文件夹。所以在这种情况下,将有 4 个 main.exe
实例分别在 input_folder1、input_folder2、input_folder3、input_folder4
上运行。
使用像 OpenMP 这样的库而不是关联调度有什么好处?我想
- 与
n
个内核的n
个程序实例相比,单个程序实例的内存使用量更少,单个堆栈和堆 - 更好的缩放
但我真的希望看到性能提升吗?为什么会这样?
最佳答案
如果您的问题是简单的并行问题,单独输入文件中的数据之间没有交互,那么您可能看不到 OpenMP 的加速,甚至可能会变慢,因为内存分配和其他各种因素然后必须是线程安全的。单线程进程可以获得很多效率,事实上在 GNU libc 上也是如此,在 POSIX 线程支持中的链接意味着您还可以更慢地执行 malloc
关于c++ - 使用 OpenMP 与 Affinity 调度进行软件并行化?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36753263/