r - 在 dplyr 中使用不同的分组变量进行总结

标签 r dplyr grouping summarize

我想为我希望执行的每个摘要使用不同的分组变量来总结一个数据框。例如,我有三个变量(x1、x2、x3)。我想按 x1 对数据框进行分组并获取该组中的观察数,但我想对 x2 和 x3 执行相同的操作。

我想用同一个管道 block 来完成这个,但到目前为止,我想出的唯一解决方案是为我想要的每个单独的分组保存多个输出。

重现我的数据框:

x1 <- c(0,1,1,2,2,3,3,3,4,4,5,6,6,7,8,9,9,10)
x2 <- c(0,0,1,1,0,1,2,0,0,2,1,0,3,4,2,3,0,3)
x3 <- c(0,1,0,1,2,2,1,3,4,2,4,6,3,3,6,6,9,7)
df <- data.frame(x1,x2,x3)

我的预期输出看起来像这样,其中 x 是变量的最小和最大数量,n_x1-3 是特定数量的观察数量并将该变量用作分组变量:

       x     n_x1     n_x2     n_x3
 1     0        1        7        2
 2     1        2        4        3
 3     2        2        3        3
 4     3        3        3        3
 5     4        2        1        2
 6     5        1       NA       NA
 7     6        2       NA        3
 8     7        1       NA        1
 9     8        1       NA       NA
10     9        2       NA        1
11    10        1       NA       NA

到目前为止,我已经想出了按每个变量分别进行汇总和分组,然后作为最后一步将它们连接在一起。

x1_count <- df %>%
  group_by(x1) %>%
  summarise(n_x1=n())

x2_count <- df %>%
  group_by(x2) %>%
  summarise(n_x2=n())

x3_count <- df %>%
  group_by(x3) %>%
  summarise(n_x3=n())

all_count <- full_join(x1_count, x2_count,
                       by=c("x1"="x2")) %>%
  full_join(., x3_count,
            by=c("x1"="x3")) %>%
  rename("x"="x1")

是否有某种类型的工作可以让我不必输出多个数据帧然后将它们连接在一起。我更喜欢更简洁、更优雅的解决方案。

最佳答案

一个简单的 tidyr 解决方案

library(tidyr)
df %>%
  pivot_longer(everything(),names_to="variables",values_to="values") %>%
  group_by(variables,values) %>%
  summarize(n_x=n()) %>%
  ungroup() %>%
  pivot_wider(names_from = variables,values_from=n_x)

# A tibble: 11 x 4
   values    x1    x2    x3
    <dbl> <int> <int> <int>
 1      0     1     7     2
 2      1     2     4     3
 3      2     2     3     3
 4      3     3     3     3
 5      4     2     1     2
 6      5     1    NA    NA
 7      6     2    NA     3
 8      7     1    NA     1
 9      8     1    NA    NA
10      9     2    NA     1
11     10     1    NA    NA

关于r - 在 dplyr 中使用不同的分组变量进行总结,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61684800/

相关文章:

r - xtable 和标题对齐

r - 如何直接从 R 中的网站读取 file.rar

r - mutate_at 使用函数滞后但保留第一行

相当于 R "split"函数的 Python

xslt 1.0 按属性分组 (muenchian)

r - 合并重复行

r - 如何仅提供R Markdown 引用中的年份?

r - 使用 'summarise' 的数据帧列的第二(或第三)最大值

r - 使用 `dplyr` 过滤具有 n 个以上成员的组

java - 如何在 Java 8 中使用特定条件对列表列表进行分组