r - 在R中,如何按组计算所有列的均值?

标签 r group-by mean

我需要使用2个变量分组的R来获取大型数据集所有列的均值。

让我们用mtcars尝试一下:

library(dplyr)
g_mtcars <- group_by(mtcars, cyl, gear)
summarise(g_mtcars, mean (hp))

# Source: local data frame [8 x 3]
# Groups: cyl [?]
# 
#     cyl  gear `mean(hp)`
#   <dbl> <dbl>      <dbl>
# 1     4     3    97.0000
# 2     4     4    76.0000
# 3     4     5   102.0000
# 4     6     3   107.5000
# 5     6     4   116.5000
# 6     6     5   175.0000
# 7     8     3   194.1667
# 8     8     5   299.5000

它适用于“hp”,但我需要获取mtcar的其他所有列的均值(组成一组的“cyl”和“gear”除外)。
数据集很大,有几列。像这样手动输入:summarise(g_mtcars, mean (hp), mean(drat), mean (wt),...)这并不实用。

最佳答案

Edit2:dplyr的最新版本建议将常规summariseacross函数一起使用,如下所示:

library(dplyr)
mtcars %>% 
group_by(cyl, gear) %>%
summarise(across(everything(), mean))
您正在寻找的是?summarise_all?summarise_each中的dplyr编辑:完整代码:
library(dplyr)
mtcars %>% 
    group_by(cyl, gear) %>%
    summarise_all("mean")

# Source: local data frame [8 x 11]
# Groups: cyl [?]
# 
#     cyl  gear    mpg     disp       hp     drat       wt    qsec    vs    am     carb
#   <dbl> <dbl>  <dbl>    <dbl>    <dbl>    <dbl>    <dbl>   <dbl> <dbl> <dbl>    <dbl>
# 1     4     3 21.500 120.1000  97.0000 3.700000 2.465000 20.0100   1.0  0.00 1.000000
# 2     4     4 26.925 102.6250  76.0000 4.110000 2.378125 19.6125   1.0  0.75 1.500000
# 3     4     5 28.200 107.7000 102.0000 4.100000 1.826500 16.8000   0.5  1.00 2.000000
# 4     6     3 19.750 241.5000 107.5000 2.920000 3.337500 19.8300   1.0  0.00 1.000000
# 5     6     4 19.750 163.8000 116.5000 3.910000 3.093750 17.6700   0.5  0.50 4.000000
# 6     6     5 19.700 145.0000 175.0000 3.620000 2.770000 15.5000   0.0  1.00 6.000000
# 7     8     3 15.050 357.6167 194.1667 3.120833 4.104083 17.1425   0.0  0.00 3.083333
# 8     8     5 15.400 326.0000 299.5000 3.880000 3.370000 14.5500   0.0  1.00 6.000000

关于r - 在R中,如何按组计算所有列的均值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40947288/

相关文章:

ssl - https 中的 cors 设置

r - 如何自定义ggplotly的工具提示?

当聚合函数相等时 MySQL Group 返回多个结果

mysql - 每 6 个月在一条记录中分组

mysql - 使用连接、分组依据和聚合函数的 SQL 选择查询

r - 在矩阵上使用带有均值函数的 mapply

R从第二个数据框计算新列

r - 如何仅从路径提取文件/文件夹名?

R(和 dplyr?) - 按组从数据帧中采样,最大样本量为 n

r - 根据 R 数据框中的名称对列进行平均