我正在尝试实现我在网上找到的建议,但我已经走到了我想去的地方。
这是一个可重现的示例:
library(tidyverse)
library(dplyr)
library(rlang)
data(mtcars)
filter_expr = "am == 1"
mutate_expr = "gear_carb = gear*carb"
select_expr = "mpg , cyl"
mtcars %>% filter_(filter_expr) %>% mutate_(mutate_expr) %>% select_(select_expr)
过滤器 表达工作正常。
变异 表达式也有效,但新变量的名称为 gear_carb = 齿轮*碳水化合物 而不是预期的 gear_carb .
最后,选择 表达式返回异常。
最佳答案
正如评论中提到的,dplyr 动词的下划线版本现在已被弃用。正确的做法是使用quasiquotation .
使用 select
解决您的问题,您只需要修改 select_expr
包含多个表达式:
## I renamed your variables to *_str because they are, well, strings.
filter_str <- "am == 1"
mutate_str <- "gear_carb = gear*carb"
select_str <- "mpg; cyl" # Note the ;
使用
rlang::parse_expr
将这些字符串转换为未计算的表达式:## Notice the plural parse_exprs, which parses a list of expressions
filter_expr <- rlang::parse_expr( filter_str )
mutate_expr <- rlang::parse_expr( mutate_str )
select_expr <- rlang::parse_exprs( select_str )
鉴于未计算的表达式,我们现在可以将它们传递给
dplyr
动词。写作 filter( filter_expr )
无法工作,因为 filter
将查找名为 filter_expr
的列在您的数据框中。相反,我们想要访问存储的表达式 内 filter_expr
.为此,我们使用 !!
运营商让dplyr
动词知道参数应该扩展到它的内容(这是我们感兴趣的未评估表达式):mtcars %>% filter( !!filter_expr )
# mpg cyl disp hp drat wt qsec vs am gear carb
# 1 21.0 6 160.0 110 3.90 2.620 16.46 0 1 4 4
# 2 21.0 6 160.0 110 3.90 2.875 17.02 0 1 4 4
# 3 22.8 4 108.0 93 3.85 2.320 18.61 1 1 4 1
# 4 32.4 4 78.7 66 4.08 2.200 19.47 1 1 4 1
mtcars %>% mutate( !!mutate_expr )
# mpg cyl disp hp drat wt qsec vs am gear carb gear_carb = gear * carb
# 1 21.0 6 160.0 110 3.90 2.620 16.46 0 1 4 4 16
# 2 21.0 6 160.0 110 3.90 2.875 17.02 0 1 4 4 16
# 3 22.8 4 108.0 93 3.85 2.320 18.61 1 1 4 1 4
# 4 21.4 6 258.0 110 3.08 3.215 19.44 1 0 3 1 3
如果是
select
, 我们有多个表达式,由 !!!
处理反而:mtcars %>% select( !!!select_expr )
# mpg cyl
# Mazda RX4 21.0 6
# Mazda RX4 Wag 21.0 6
# Datsun 710 22.8 4
附言还值得一提的是
select
直接处理字符串向量,无需 rlang::parse_expr()
他们先:mtcars %>% select( c("mpg", "cyl") )
# mpg cyl
# Mazda RX4 21.0 6
# Mazda RX4 Wag 21.0 6
# Datsun 710 22.8 4
关于r - 如何将字符串中的表达式传递给 dplyr 0.7.2 中的动词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49803104/