r - 在 dplyr 中使用带有 udf 的标准评估

标签 r dplyr

我正在使用 dplyr 进行编程,因此我正在使用标准评估。我创建了一个通用函数,以数据框和列名作为参数。在该函数中,我想应用我自己在数据框列上编写的另一个函数。这是一个最小的例子:

some_udf <- function(x) mean(x + 3)
generic_function <- function(dat, input_var){
  dat %>% dplyr::summarise_(mean_3 = sprintf("some_udf(%s)", input_var))
}

现在,当运行通用函数时,我会收到以下错误:

generic_function(mtcars, 'cyl')

Error: could not find function "some_udf"

some_udf 替换为基本 R 函数(例如 meansd)时,一切正常。

有人可以向我解释一下为什么 udf 在这种情况下不起作用以及解决方案是什么?

最佳答案

这本质上是this question的重复。 ,它没有公认的答案,但正如 David Arenburg 和 MrFlick 在评论中指出的那样,您需要将表达式作为公式传递,以便正确的环境上下文可用:

library(dplyr)

some_udf <- function(x) mean(x + 3)
generic_function <- function(dat, input_var){
    dat %>% 
        summarise_(mean_3 = as.formula(sprintf("~some_udf(%s)", input_var)))
}

generic_function(mtcars, 'cyl')
#   mean_3
# 1 9.1875

关于r - 在 dplyr 中使用带有 udf 的标准评估,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41634744/

相关文章:

r - 如何强制分派(dispatch)到 R 中的内部泛型?

python - 在sparklyr中将12小时制转换为24小时制

r - 按组选择随机连续行作为组长度的比例

r - 在循环中将 data.frame 行绑定(bind)到另一个 data.frame 的有效方法?

python - pandas 使用同一列中的值进行分组并计算结果(包括 R 等效项)

r - 如何在R中按组删除前导和尾随NA的行

r - 解释 ARIMA 模型的预测

mysql - RMariaDB : caching_sha2_password error when connecting to MySQL

r - 插值年中平均值

r - 查看每个 id 是否有任何非 NA 值