r - 将 dplyr `filter()` 的过滤器存储在变量中

标签 r dplyr

我想在同一组条件下过滤多个数据帧。所以我想将这些过滤器设置为 filter() 调用之外的变量。

例如

mtcars %>%
  filter(cyl > 4, disp > 100)

我尝试这样做:

filters <- c(cyl > 4, disp > 100)
mtcars %>%
  filter(filters)

但这不起作用,因为当我设置 filters 变量时,它会查找数据帧列。

> filters <- c(cyl > 4, disp > 100)
Error: object 'cyl' not found

实现这一目标的最佳方法是什么?

最佳答案

rlang 包允许您创建未计算的表达式,然后可以使用特殊的 !! 表示法进行交换。如果您使用 dplyr,则已经加载了 rlang 的关键部分。请注意,对于filter,最好明确组合多个条件,而不是依赖filter对多个参数的隐式“与”。

my.filter <- quo(cyl > 4 & disp > 100)

filter(mtcars, !!my.filter)

    mpg cyl  disp  hp drat    wt  qsec vs am gear carb
1  21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
2  21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
3  21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1
4  18.7   8 360.0 175 3.15 3.440 17.02  0  0    3    2
5  18.1   6 225.0 105 2.76 3.460 20.22  1  0    3    1
6  14.3   8 360.0 245 3.21 3.570 15.84  0  0    3    4
7  19.2   6 167.6 123 3.92 3.440 18.30  1  0    4    4
8  17.8   6 167.6 123 3.92 3.440 18.90  1  0    4    4
9  16.4   8 275.8 180 3.07 4.070 17.40  0  0    3    3

正如 Artem 指出的,您可以将逗号符号与复数 quos 函数和 !!! 运算符一起使用:

my.filter <- quos(cyl > 4, disp > 100)

filter(mtcars, !!!my.filter)

关于r - 将 dplyr `filter()` 的过滤器存储在变量中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50160266/

相关文章:

r - Dplyr 编写一个以列名作为输入的函数

r - 如何使用一些 apply 函数来解决 R 中需要两个 for 循环的问题

r - 修改数据框中变量的值

r - 在 R 中将列表作为长格式的列的 tibble?

r - 创建一个虚拟变量列来指示记录是否位于第二个数据帧中?

r - extrafont::loadfonts(device = "win") 在 Rprofile 中不起作用,但在控制台中很好

json - 解析R中的嵌套结构

r - 在 R 中创建一个按 ID 分组的计数器变量,该变量有条件地重置

r - 通过group_by中的正则表达式组合分类数据帧中的计数?

apache-spark - 将组计数列添加到 PySpark 数据帧