r - 序列化错误(数据,节点 $con): error writing to connection

标签 r parallel-processing

我目前正在尝试运行一些实现并行处理的代码,但我遇到了这个错误:

Error: cannot allocate vector of size 2.1 Gb
Execution halted
Error in serialize(data, node$con) : error writing to connection
Calls: %dopar% ... postNode -> sendData -> sendData.SOCKnode -> serialize
Execution halted
Warning message:
system call failed: Cannot allocate memory 
Error in unserialize(node$con) : error reading from connection
Calls: <Anonymous> ... doTryCatch -> recvData -> recvData.SOCKnode -> 
unserialize Execution halted

我似乎无法弄清楚为什么会出现内存问题。如果我将代码从 foreach 循环中取出或将 foreach 更改为 for 循环,它工作得很好,所以我认为它与代码本身的内容无关,而是与并行化有关。此外,它似乎在代码开始执行后很快就会抛出错误。任何想法为什么会发生这种情况?下面是我的代码:

list_storer <- list() 

list_storer <- foreach(bt=2:bootreps, .combine=list, .multicombine=TRUE) %dopar% {
ur <- sample.int(nrow(dailydatyr),nrow(dailydatyr),replace=TRUE)
ddyr_boot <- dailydatyr[ur,]
weightvar <- ddyr_boot[,c('ymd1_IssueD','MatD_ymd2')]
weightvar <- abs(weightvar)
x <- DM[ur,]
y<-log(ddyr_boot$dirtyprice2/ddyr_boot$dirtyprice1)
weightings <- rep(1,nrow(ddyr_boot))
weightings <- weightings/(ddyr_boot$datenum2-ddyr_boot$datenum1)

treg <- repeatsales(y,x,maxdailyreturn,weightings,weightvar)


zbtcol <- 0
cnst <- NULL


if (is.null(dums) == FALSE){
  zbtcol <- length(treg)-ncol(x)
  cnst <- paste("tbs(",dums,")_",(middleyr),sep="")
  if (is.null(interactVar) == FALSE){ 
    ninteract <- (length(treg)-ncol(x)-length(dums))/length(dums)
    interact <- unlist(lapply(cnst,function(xla) paste(xla,"*c",c(1:ninteract),sep="")))
    cnst <- c(cnst,interact)}
  }     
}       

tregtotal <- tregtotal + (is.na(treg)==FALSE)
treg[is.na(treg)==TRUE] <- 0

list_storer[[length(list_storer)+1]] <- treg

}

stopImplicitCluster(cl)

最佳答案

foreach 完成的并行化是空间与时间的权衡。我们以更高的内存使用量为代价获得更快的执行速度。内存使用量较高的原因是启动了多个 R 进程,每个进程都需要自己的内存来保存计算所需的数据。目前 foreach 使用隐式 PSOCK 集群。解决此问题的一种方法是使用较少数量的进程显式创建集群。多低取决于您拥有的内存量以及每个作业的内存要求:

n <- parallel::detectCores()/2 # experiment!
cl <- parallel::makeCluster(n)
doParallel::registerDoParallel(cl)
<foreach>
parallel::stopCluster(cl)

关于r - 序列化错误(数据,节点 $con): error writing to connection,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51054423/

相关文章:

R 使用 dcast、melt 和 concatenation reshape 数据框

r - 在带有 map() 的嵌套数据框中使用 filter()(和其他 dplyr 函数)

R:读取.tab文件

c - 带有 pragma omp parallel for 的嵌套循环,困惑起来

python - 并行 : Run for loop in Python

r - 在导航栏 Shiny 布局中使用引导页脚类

r - 在 Rstudio 中本地调试第 3 方 R 包/库的正确方法

c++ - CUDA channel ID 与基于 threadIdx.x 的计算

python - 在 python 中使用多处理并行化递归代码

javascript - 异步运行两个 Promise,但优先考虑第一个 Promise 的结果