R across 只找到正值或只找到负值 tidyverse

标签 r dplyr across

在 dplyr Column-wise operations有这个例子:

df <- tibble(x = c("a", "b"), y = c(1, 1), z = c(-1, 1))
# Find all rows where EVERY numeric variable is greater than zero
df %>% filter(across(where(is.numeric), ~ .x > 0))
#> # A tibble: 1 x 3
#>   x         y     z
#>   <chr> <dbl> <dbl>
#> 1 b         1     1

如果我们稍微改变一下标题:

df <- tibble(x = c("a", "b", "c"), y = c(1, 1, -1), z = c(-1, 1, -1))

我们想要为两列获取负值或正值,我们需要命名这些列:

df %>% filter((y > 0 & z > 0) | (y < 0 & z < 0))
#> # A tibble: 2 x 3
#>  x         y     z
#>  <chr> <dbl> <dbl>
#> 1 b         1     1
#> 2 c        -1    -1

使用across()如何做到这一点?

df %>% filter(across(where(is.numeric), ~ .x > 0 | .x < 0))
#> # A tibble: 3 x 3
#>  x         y     z
#>  <chr> <dbl> <dbl>
#> 1 a         1    -1
#> 2 b         1     1
#> 3 c        -1    -1

最佳答案

我们必须从一组条件中检查所有 TRUE 或所有 FALSE,例如 c(T, T) >c(T, F)c(F, F)。现在-

  • if_all 将过滤 c(T, T)
  • !if_any 将从 ! 中再次过滤 c(T, T),即对剩余值取反
  • 这两个将由 | 连接,即 OR
  • 因此,我们将只有 c(T, T)c(F, F)

这样就可以了

df %>% filter(if_all(where(is.numeric), ~ .x > 0) | !if_any(where(is.numeric), ~ .x < 0))

# A tibble: 2 x 3
  x         y     z
  <chr> <dbl> <dbl>
1 b         1     1
2 c        -1    -1

替代方案

df %>% filter(if_all(where(is.numeric), ~ .x > 0) | across(where(is.numeric), ~ .x < 0))

# A tibble: 2 x 3
  x         y     z
  <chr> <dbl> <dbl>
1 b         1     1
2 c        -1    -1

让我们看一下更大的例子

set.seed(201)
df <- data.frame(A = LETTERS[1:10], x = rnorm(10), y = rnorm(10), z = -1*rnorm(10))

> df
   A           x           y           z
1  A  0.28606069  0.69329617  0.24400084
2  B -0.34454603  0.22380936  0.98825314
3  C  0.32576373  0.39845694 -1.24206048
4  D -1.69658097  1.01347438  1.68266603
5  E -1.28548252 -0.64785307 -1.44289063
6  F -0.07503189  0.64845271  0.46543975
7  G  0.26693735  0.20734270 -0.69366150
8  H  0.05593404  0.06439014  0.08772557
9  I -2.30403431  0.66938092  0.95508038
10 J  0.18900414 -0.37425445 -0.17010088

> df %>% filter(if_all(where(is.numeric), ~ .x > 0) | !if_any(where(is.numeric), ~ .x < 0))
  A           x           y           z
1 A  0.28606069  0.69329617  0.24400084
2 E -1.28548252 -0.64785307 -1.44289063
3 H  0.05593404  0.06439014  0.08772557

关于R across 只找到正值或只找到负值 tidyverse,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66266532/

相关文章:

r - 在使用变量调用的函数中实现 mutate

r - 可以关注多列时过滤行

r - 如何计算 R 中各行列的纬度和经度之间的距离?

r - 如何将tapply()的输出放入data.frame中

r - dplyr group_by 和计数中找不到对象错误

r - 为多组列动态创建行的替代(更快)方法

r - 如何在变异后将 t.test() 应用于多对列

r - 如何使用函数查看文件中的结果并*应用?

以 Shiny 的方式注册重复的键盘按键

r - 选定列的 mutate_each