python - 多处理器环境下的 scikit-learn 网格搜索

标签 python parallel-processing mpi scikit-learn

我能够在我的四核处理器上本地并行运行 scikit-learn 函数 GridSearchCV。我想知道使用 MPI 的某些模块(例如 mpi4py)将其扩展到多处理器环境是否简单。

我对此很陌生,所以如果能提供额外的相关信息,我将不胜感激。我现在正在浏览 mpi4py 的文档。

谢谢!

最佳答案

你可以看看GridSearchCV implementation作为在 MPI 之上实现您自己的变体的灵感。然而,MPI 可能无法提供一种自然的方式来避免通过网络一遍又一遍地传输输入训练集数据。

另一种方法是使用 IPython.parallel如本 tutorial 中所述.本教程中使用的pyrallel helper lib的代码也是available on github .

关于python - 多处理器环境下的 scikit-learn 网格搜索,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18985303/

相关文章:

python - 您将什么称为允许持久操作的非持久数据结构?

python - 为什么这个 asyncio.Task 永远不会完成取消?

python - 扩展 Python 列表(例如 l += [1])是否保证是线程安全的?

python - 如何在值之后命名 python 变量?

c - MPI串口主要功能

r - 为多个操作系统使用并行或 doParallel 的自定义包作为 CRAN 包

python - 为什么并行任务第一次总是很慢?

c - 在并行处理中,如何使用mathematica让每个处理器执行一个程序 block

c - 带有 C : Passive RMA synchronization 的 MPI

java - 从性能角度来看,对于典型的并行场景,使用 Hadoop 比使用 MPI 更好吗?