r - 使用 Caret 和 xgboost 训练分类模型期间的警告消息

标签 r machine-learning r-caret xgboost

我在 R 中使用 Caret 来运行用于机器学习分类问题的 xgboost 算法。

运行以下R代码后,我收到警告消息(如下所示):

cl <- makeCluster(10, type = "SOCK")

registerDoSNOW(cl)

caret.cv <- train(market ~ ., 
                  data = mydata.train,
                  method = "xgbTree",
                  tuneGrid = tune.grid,
                  trControl = train.control)


Warning messages:
1: closing unused connection 12 (<-John-laptop.mycompany.local:11916) 
2: closing unused connection 11 (<-John-laptop.mycompany.local:11916) 
3: closing unused connection 10 (<-John-laptop.mycompany.local:11916) 
4: closing unused connection 9 (<-John-laptop.mycompany.local:11916) 
5: closing unused connection 8 (<-John-laptop.mycompany.local:11916) 
6: closing unused connection 7 (<-John-laptop.mycompany.local:11916) 
7: closing unused connection 6 (<-John-laptop.mycompany.local:11916) 
8: closing unused connection 5 (<-John-laptop.mycompany.local:11916) 
9: closing unused connection 4 (<-John-laptop.mycompany.local:11916) 
10: closing unused connection 3 (<-John-laptop.mycompany.local:11916)

我可以忽略它们并继续分析吗?还是幕后出了问题?

最佳答案

评论太长了...

当您启动集群时,R 与每个进程建立了连接。警告消息只是连接被自动关闭。

停止集群并显式关闭它们会更优雅,但如果没有任何问题,您实际上可以忽略它。

类似 stopCluster(cl) (取决于您加载的库)将停止集群,但有时您仍然会收到有关未使用连接的错误 - 这不太可能是一个真正的问题,因为您未接近连接限制。

请注意,在笔记本电脑上 10 个线程可能过多 - 尝试使用 parallel 包中的 detectCores() 来获取处理器数量并使用它。

关于r - 使用 Caret 和 xgboost 训练分类模型期间的警告消息,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47328222/

相关文章:

tensorflow - 声明嵌入层时出现 ResourceExhaustedError (Keras)

r - 使用插入符优化二元分类的偏差

r - 使用 caret 包的变量重要性(错误);随机森林算法

r - R中的全奇异值分解

r - 在 Rmarkdown 中通过 fig.scap(图表表)或 fig.cap(标题)传递斜体

r - 如何在r中使用dplyr在特定位置插入空白行

r - 对于 > 2 个类别的结果,插入符训练方法不起作用(所有准确度结果都有问题)

从数据框中删除特定行

python - 用 Pandas 导入数据时卡住了错误

python - 如何在不使用numpy或tensorflow中的任何循环的情况下获取矩阵行?