r - R 中的 tidyverse VS dplyr - 处理能力/性能

标签 r dplyr tidyverse memory-efficient

我对 R 编程比较陌生,并且一直在进行研究,但找不到该主题的答案。

在代码开头加载完整的 tidyverse 是否比仅加载 dplyr 包需要更多的处理能力。例如,我可能只需要 dplyr 中可以找到的函数。我是否通过加载完整的 tidyverse 来降低代码的速度/性能,考虑到它包含其他几个包,它必须是一个更大的包?或者无论我选择加载哪个包,处理速度都是相同的。从编码的方便性来看,我宁愿使用 tidyverse,因为它更全面,但如果我使用更多的处理能力,那么加载不太全面的包可能会更有效。

最佳答案

正如 NelsonGon 评论的那样,加载包不会降低您的处理速度。虽然包本身需要时间来加载,但它可能可以忽略不计,特别是如果您已经想要加载 dplyr、tidyr 和 purrr 等。

在搜索路径上加载更多库(例如使用library(dplyr))可能不会影响您的速度,但可能会导致命名空间错误。

现在,有一些基准比较 dpylr、data.table 和 base R,dpylr 往往更慢,但是 YMMV。这是我找到的:https://www.r-bloggers.com/2018/01/tidyverse-and-data-table-sitting-side-by-side-and-then-base-r-walks-in/ 。因此,如果您正在执行需要很长时间的操作,那么使用 data.table 可能是值得的。

关于r - R 中的 tidyverse VS dplyr - 处理能力/性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68774166/

相关文章:

r - 如何按组填写范围内缺失的日期

r - 满足给定条件的不同列之间的值差异

r - 在 tidyverse 中不中断管道的情况下打印中间结果

r - 如何删除R中匹配超过1个模式的多行?

c++ - 在 R 脚本中使用 C++ 程序的返回值

c++ - 如何在 C++ 和 R 中使用完全相同的数字格式?

r - 将 renv 用于私有(private) GitLab 包

r - 如何按包含 dbplyr 中的变量的字符串进行过滤

r - 使用 R 检查是否有 n 列包含相同的值?

r - 如何在整个 data.frame 中搜索字符串