r - 如何将字符串中的表达式传递给 dplyr 0.7.2 中的动词

标签 r dplyr rlang

我正在尝试实现我在网上找到的建议,但我已经走到了我想去的地方。

这是一个可重现的示例:

library(tidyverse)
library(dplyr)
library(rlang)

data(mtcars)

filter_expr = "am == 1"

mutate_expr = "gear_carb = gear*carb"

select_expr = "mpg , cyl"

mtcars %>% filter_(filter_expr) %>% mutate_(mutate_expr) %>% select_(select_expr)

过滤器 表达工作正常。

变异 表达式也有效,但新变量的名称为 gear_carb = 齿轮*碳水化合物 而不是预期的 gear_carb .

最后,选择 表达式返回异常。

最佳答案

正如评论中提到的,dplyr 动词的下划线版本现在已被弃用。正确的做法是使用quasiquotation .

使用 select 解决您的问题,您只需要修改 select_expr包含多个表达式:

## I renamed your variables to *_str because they are, well, strings.
filter_str <- "am == 1"
mutate_str <- "gear_carb = gear*carb"
select_str <- "mpg; cyl"                # Note the ;

使用 rlang::parse_expr将这些字符串转换为未计算的表达式:
## Notice the plural parse_exprs, which parses a list of expressions
filter_expr <- rlang::parse_expr( filter_str )
mutate_expr <- rlang::parse_expr( mutate_str )
select_expr <- rlang::parse_exprs( select_str )

鉴于未计算的表达式,我们现在可以将它们传递给 dplyr动词。写作 filter( filter_expr )无法工作,因为 filter将查找名为 filter_expr 的列在您的数据框中。相反,我们想要访问存储的表达式 filter_expr .为此,我们使用 !!运营商让dplyr动词知道参数应该扩展到它的内容(这是我们感兴趣的未评估表达式):
mtcars %>% filter( !!filter_expr )
#     mpg cyl  disp  hp drat    wt  qsec vs am gear carb
# 1  21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
# 2  21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
# 3  22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1
# 4  32.4   4  78.7  66 4.08 2.200 19.47  1  1    4    1

mtcars %>% mutate( !!mutate_expr )
#     mpg cyl  disp  hp drat    wt  qsec vs am gear carb gear_carb = gear * carb
# 1  21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4                      16
# 2  21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4                      16
# 3  22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1                       4
# 4  21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1                       3

如果是 select , 我们有多个表达式,由 !!! 处理反而:
mtcars %>% select( !!!select_expr )
#                      mpg cyl
# Mazda RX4           21.0   6
# Mazda RX4 Wag       21.0   6
# Datsun 710          22.8   4

附言还值得一提的是select直接处理字符串向量,无需 rlang::parse_expr()他们先:
mtcars %>% select( c("mpg", "cyl") )
#                      mpg cyl
# Mazda RX4           21.0   6
# Mazda RX4 Wag       21.0   6
# Datsun 710          22.8   4

关于r - 如何将字符串中的表达式传递给 dplyr 0.7.2 中的动词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49803104/

相关文章:

r - rlang 包中的 sym() 和 parse_expr() 有什么区别?

r - 如何使用 stringr 从字符串中提取多个重叠的字符串?

r - 通过apply将参数传递给迭代函数

r - 通过使用 tibble 中不同行的值来改变值

r - 为带有管道的对象设置属性

R如何使用带有filter或filter_的curl curl?

r - geom_area 高于临界水平时不同的填充颜色

r - 从R中的文件读取数据帧时如何跳过无效行?

r - 根据整数值查找表

R dplyr - 动态排列行顺序