c++ - 使用 OpenMP 与 Affinity 调度进行软件并行化?

标签 c++ c parallel-processing openmp affinity

场景:我有一个程序可以使用 OpenMP 轻松并行化,假设程序的主循环是一个 for 循环和其中的独立数据,因此并行化它是微不足道的。但是目前我将其并行化,而是使用关联调度。

此程序对由命令行参数中的文件夹指定的一些输入文件执行工作。要并行运行这个程序,可以像这样创建一个 bat 文件:

start \affinity 1 "1" bat1
start \affinity 2 "2" bat2
start \affinity 3 "3" bat3
start \affinity 4 "4" bat4

其中 bat1 - 4 是一个 bat 文件,它调用 main.exe,每个 bat 文件都有不同的输入文件夹。所以在这种情况下,将有 4 个 main.exe 实例分别在 input_folder1、input_folder2、input_folder3、input_folder4 上运行。

使用像 OpenMP 这样的库而不是关联调度有什么好处?我想

  • n 个内核的 n 个程序实例相比,单个程序实例的内存使用量更少,单个堆栈和堆
  • 更好的缩放

但我真的希望看到性能提升吗?为什么会这样?

最佳答案

如果您的问题是简单的并行问题,单独输入文件中的数据之间没有交互,那么您可能看不到 OpenMP 的加速,甚至可能会变慢,因为内存分配和其他各种因素然后必须是线程安全的。单线程进程可以获得很多效率,事实上在 GNU libc 上也是如此,在 POSIX 线程支持中的链接意味着您还可以更慢地执行 malloc

关于c++ - 使用 OpenMP 与 Affinity 调度进行软件并行化?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36753263/

相关文章:

c - 两个函数同时执行

.net - 无限并行功能

c++ - 'memchr' 的冲突类型

c++ - 动态与静态内存在清洁度和速度方面的最佳实践

c++ - Damerau–Levenshtein distance (Edit Distance with Transposition) c实现

c - OMP C 中的嵌套 for 循环

parallel-processing - 为什么在进行并行计算时打印到控制台会混淆?

c++ - 在结构初始化

c - 在 Makefile 中添加命令的运行时参数

c - Linux环境下的ARM裸机开发