R 整洁的行意味着来自列的子集

This question already has answers here:

Dplyr - Mean for multiple columns

(4 个回答)

2年前关闭。

我想从数据框中的多列计算汇总变量。这在输入所有行名称时是可能的，但我想使用 starts_with() 和类似的函数。 IE。

df <- data.frame(A1 = rnorm(100, 0, 1),
                 A2 = rnorm(100, 0, 1),
                 A3 = rnorm(100, 0, 1),
                 B1 = rnorm(100, 0, 1),
                 B2 = rnorm(100, 0, 1))

什么工作:

library(tidyverse)
df %>% mutate(A = (A1 + A2 + A3)/3)
df %>% mutate(A = rowMeans(select(., A1:A3)))

但是，前者在汇总许多变量时会很烦人，而后者在汇总许多行时会变得非常慢。我怀疑必须有一个更快的解决方案。

什么不起作用:

df %>% mutate(A = mean(A1:A3))
df %>% group_by(row_number()) %>% mutate(A = mean(A1:A3))
df %>% group_by(row_number()) %>% mutate(A = mean(starts_with("A")))

所以我的问题是:有没有办法在 mutate() 中使用 mean() 等来计算行均值，理想情况下不必拼出每个变量？

最佳答案

在我之前的版本中，我认为 rowMeans 是问题所在，但实际上减缓计算的是 select 的使用 - 最好坚持使用 grep 系列:

df %>% mutate(A = rowMeans(.[, grepl("^A", names(.))]))

关于R 整洁的行意味着来自列的子集，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54628321/

上一篇：rdf - 猫头鹰有芝麻之类的东西吗

下一篇：r - data.table 相当于 tidyr::complete with group_by with on and by 语法

相关文章：

r - 包含从其他 Rcpp 包导出的代码时性能下降

r - 空白字符串不能用R中的NA替换

java - 如何从 vaadin 的一行中获取特定值？

r - 在 R 中按行计算 2 个值之间的 NA 数量

r - 按顺序分组，然后查找列中的最小值

r - 如何对齐文本输入旁边的按钮？

r - R 中幂律分布的拟合优度检验

r - 为数据框中两列中的数据创建 Bland-Altman 图

r - 评估作为参数传递的列表内的表达式

r - 在 R 中透视具有相同变量的多个二进制度量的表