我有一个表格,其格式类似于
user data
1234 42
1234 51
1234 50
1235 61
1235 55
我想根据用户创建平均“数据”的直方图。换句话说,我想将表中具有相同 userID
的行组合起来,并得出它们的平均值。我如何在大型数据集上执行此操作?
最佳答案
只需使用tapply
(假设您的原始数据框名为dat
):
avgdata=tapply(dat$data,dat$user,FUN=mean)
hist(avgdata)
关于减少 R 中的表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7756592/