R:使用 ddply 将函数应用于数据子集

标签 r plyr

我正在尝试使用 ddply 方法获取包含有关 3000 部电影的各种信息的数据框,然后计算每种类型的平均总收入。我是 R 的新手,我已经阅读了此处与 ddply 相关的所有问题,但我似乎仍然无法理解。这是我现在所拥有的:

> attach(movies)
> ddply(movies, Genre, mean(Gross))
Error in llply(.data = .data, .fun = .fun, ..., .progress = .progress,  : 
.fun is not a function.

我应该如何编写一个函数,该函数取每组电影的“总”列中的值的平均值,按类型分组?我知道这似乎是一个简单的问题,但文档对我来说真的很困惑,而且我对 R 语法还不太熟悉。

除了 ddply 之外,还有其他方法可以使这更容易吗?

谢谢!!

最佳答案

这是使用 ggplot2 中可用的提示数据集的示例

library(ggplot2);
mean_tip_by_day = ddply(tips, .(day), summarize, mean_tip = mean(tip/total_bill))

希望这是有用的

关于R:使用 ddply 将函数应用于数据子集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5208992/

相关文章:

r - dplyr:将函数table()应用于data.frame的每一列

R排序汇总ddply按组总和

python - 黑盒脚本执行?

r - 为什么 colSums(x, na.rm = T) 中出现错误 : invalid 'na.rm' argument in R

r - 是否有必要在 R 包中导出基本方法扩展?文档影响?

r - 错误 : only defined on a data frame with all numeric variables with ddply on large dataset

r - 获取 R 中多个变量/列的分类因素计数

R ddply 仅汇总选定/特定/逻辑行的总和

r - 在 igraph 中投影二分网络时出现内存不足错误

重构任意嵌套列表