r - doMC vs doSNOW vs doSMP vs doMPI : why aren't the various parallel backends for 'foreach' functionally equivalent?

标签 r parallel-processing plyr domc

我已经在不同的机器上运行了一些测试代码,总是得到相同的结果。我认为各种 do... 包背后的理念是它们可以互换用作 foreach 的 %dopar% 的后端。为什么情况并非如此?

例如,此代码片段有效:

library(plyr)
library(doMC)
registerDoMC()
x <- data.frame(V= c("X", "Y", "X", "Y", "Z" ), Z = 1:5)
ddply(x, .(V), function(df) sum(df$Z),.parallel=TRUE)

虽然这些代码片段中的每一个都失败了:

library(plyr)
library(doSMP)
workers <- startWorkers(2)
registerDoSMP(workers)
x <- data.frame(V= c("X", "Y", "X", "Y", "Z" ), Z = 1:5)
ddply(x, .(V), function(df) sum(df$Z),.parallel=TRUE) 
stopWorkers(workers)

library(plyr)
library(snow)
library(doSNOW)
cl <- makeCluster(2, type = "SOCK")
registerDoSNOW(cl)
x <- data.frame(V= c("X", "Y", "X", "Y", "Z" ), Z = 1:5)
ddply(x, .(V), function(df) sum(df$Z),.parallel=TRUE) 
stopCluster(cl)

library(plyr)
library(doMPI)
cl <- startMPIcluster(count = 2)
registerDoMPI(cl)
x <- data.frame(V= c("X", "Y", "X", "Y", "Z" ), Z = 1:5)
ddply(x, .(V), function(df) sum(df$Z),.parallel=TRUE) 
closeCluster(cl)

在所有四种情况下,foreach(i = 1:3,.combine = "c") %dopar% {sqrt(i)} 产生完全相同的结果,所以我知道我有这些软件包在我测试过的每台机器上都已安装并正常工作。

doMC 与 doSMP、doSNOW 和 doMPI 有何不同?

最佳答案

doMC fork 当前 R 进程,因此它继承所有现有变量。所有其他后端仅传递显式请求的变量。不幸的是我没有意识到这一点,并且只使用 doMC 进行了测试 - 这是我希望在下一个版本的 plyr 中修复的问题。

关于r - doMC vs doSNOW vs doSMP vs doMPI : why aren't the various parallel backends for 'foreach' functionally equivalent?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5588914/

相关文章:

r - 使用 roxygen2 引用文章

python - 用于停止所有并行运行的程序的键盘快捷方式?

在R中重复vector的元素

重新排序因子级别 : Specify first level only

mysql - 为什么 R 上传数据比 KNIME 或 Workbench 快得多?

r - ggplot2中平铺图的条件格式颜色

r - R中非UTF-8和ASCII字符twitteR包的问题

c++ - MPI虚拟拓扑设计

c++ - 不同深度图像的TBB-并行卷积

r - 运行长度的累积和。这个循环可以矢量化吗?