我对 R 编程比较陌生,并且一直在进行研究,但找不到该主题的答案。
在代码开头加载完整的 tidyverse 是否比仅加载 dplyr 包需要更多的处理能力。例如,我可能只需要 dplyr 中可以找到的函数。我是否通过加载完整的 tidyverse 来降低代码的速度/性能,考虑到它包含其他几个包,它必须是一个更大的包?或者无论我选择加载哪个包,处理速度都是相同的。从编码的方便性来看,我宁愿使用 tidyverse,因为它更全面,但如果我使用更多的处理能力,那么加载不太全面的包可能会更有效。
最佳答案
正如 NelsonGon 评论的那样,加载包不会降低您的处理速度。虽然包本身需要时间来加载,但它可能可以忽略不计,特别是如果您已经想要加载 dplyr、tidyr 和 purrr 等。
在搜索路径上加载更多库(例如使用library(dplyr)
)可能不会影响您的速度,但可能会导致命名空间错误。
现在,有一些基准比较 dpylr、data.table 和 base R,dpylr 往往更慢,但是 YMMV。这是我找到的:https://www.r-bloggers.com/2018/01/tidyverse-and-data-table-sitting-side-by-side-and-then-base-r-walks-in/ 。因此,如果您正在执行需要很长时间的操作,那么使用 data.table 可能是值得的。
关于r - R 中的 tidyverse VS dplyr - 处理能力/性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68774166/