r - 在 dplyr 中使用带有 udf 的标准评估

我正在使用 dplyr 进行编程，因此我正在使用标准评估。我创建了一个通用函数，以数据框和列名作为参数。在该函数中，我想应用我自己在数据框列上编写的另一个函数。这是一个最小的例子:

some_udf <- function(x) mean(x + 3)
generic_function <- function(dat, input_var){
  dat %>% dplyr::summarise_(mean_3 = sprintf("some_udf(%s)", input_var))
}

现在，当运行通用函数时，我会收到以下错误:

generic_function(mtcars, 'cyl')

Error: could not find function "some_udf"

当 some_udf 替换为基本 R 函数(例如 mean 或 sd)时，一切正常。

有人可以向我解释一下为什么 udf 在这种情况下不起作用以及解决方案是什么？

最佳答案

这本质上是this question的重复。，它没有公认的答案，但正如 David Arenburg 和 MrFlick 在评论中指出的那样，您需要将表达式作为公式传递，以便正确的环境上下文可用:

library(dplyr)

some_udf <- function(x) mean(x + 3)
generic_function <- function(dat, input_var){
    dat %>% 
        summarise_(mean_3 = as.formula(sprintf("~some_udf(%s)", input_var)))
}

generic_function(mtcars, 'cyl')
#   mean_3
# 1 9.1875

关于r - 在 dplyr 中使用带有 udf 的标准评估，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41634744/

上一篇：C fscanf 段错误错误 "No source available for "fancyfile() at 0x7fff855e6d39"

下一篇：OctoberCMS 后端列表格式数字字段作为货币

相关文章：

r - 如何强制分派(dispatch)到 R 中的内部泛型？

python - 在sparklyr中将12小时制转换为24小时制

r - 按组选择随机连续行作为组长度的比例

r - 在循环中将 data.frame 行绑定(bind)到另一个 data.frame 的有效方法？

python - pandas 使用同一列中的值进行分组并计算结果(包括 R 等效项)

r - 如何在R中按组删除前导和尾随NA的行

r - 解释 ARIMA 模型的预测

mysql - RMariaDB : caching_sha2_password error when connecting to MySQL

r - 插值年中平均值

r - 查看每个 id 是否有任何非 NA 值