python - python 多处理硬件

我有一个任务，需要在许多不同的 pandas 数据帧上运行相同的函数。我将所有数据帧加载到一个列表中，然后使用 multiprocessing 模块将其传递给 Pool.map。函数代码本身已尽可能矢量化，包含一些 if/else 子句，并且没有矩阵运算。

我目前使用的是 10 核至强处理器，希望加快速度，最好是从 Pool(10) 传递到 Pool(xxx)。我看到两种可能性:

我应该专注于哪条路？还有其他选择吗？

软件:Ubuntu 18.04、Python 3.7。硬件:X99芯片组，10核至强(无HT)

最佳答案

花了一段时间，但在将其全部更改为 numpy 并实现更多矢量化后，我成功地将速度提高了 20 倍以上 - 所以感谢 Paul。 max9111 也谢谢，我会研究一下 numba。

关于python - python 多处理硬件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55576373/

相关文章：

python - 从用户id获取用户名|不和谐.py