r - R 中的 tidyverse VS dplyr - 处理能力/性能

我对 R 编程比较陌生，并且一直在进行研究，但找不到该主题的答案。

在代码开头加载完整的 tidyverse 是否比仅加载 dplyr 包需要更多的处理能力。例如，我可能只需要 dplyr 中可以找到的函数。我是否通过加载完整的 tidyverse 来降低代码的速度/性能，考虑到它包含其他几个包，它必须是一个更大的包？或者无论我选择加载哪个包，处理速度都是相同的。从编码的方便性来看，我宁愿使用 tidyverse，因为它更全面，但如果我使用更多的处理能力，那么加载不太全面的包可能会更有效。

最佳答案

正如 NelsonGon 评论的那样，加载包不会降低您的处理速度。虽然包本身需要时间来加载，但它可能可以忽略不计，特别是如果您已经想要加载 dplyr、tidyr 和 purrr 等。

在搜索路径上加载更多库(例如使用library(dplyr))可能不会影响您的速度，但可能会导致命名空间错误。

现在，有一些基准比较 dpylr、data.table 和 base R，dpylr 往往更慢，但是 YMMV。这是我找到的:https://www.r-bloggers.com/2018/01/tidyverse-and-data-table-sitting-side-by-side-and-then-base-r-walks-in/ 。因此，如果您正在执行需要很长时间的操作，那么使用 data.table 可能是值得的。

关于r - R 中的 tidyverse VS dplyr - 处理能力/性能，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/68774166/

上一篇：css flex-box 包含用于额外内部元素的空间

下一篇：python - 在安装构建依赖项之前检查 PyPI 上是否存在 Python 轮

相关文章：

r - 如何按组填写范围内缺失的日期

r - 满足给定条件的不同列之间的值差异

r - 在 tidyverse 中不中断管道的情况下打印中间结果

r - 如何删除R中匹配超过1个模式的多行？

c++ - 在 R 脚本中使用 C++ 程序的返回值

c++ - 如何在 C++ 和 R 中使用完全相同的数字格式？

r - 将 renv 用于私有(private) GitLab 包

r - 如何按包含 dbplyr 中的变量的字符串进行过滤

r - 使用 R 检查是否有 n 列包含相同的值？

r - 如何在整个 data.frame 中搜索字符串