R:使用 ddply 将函数应用于数据子集

标签 r plyr

我正在尝试使用 ddply 方法获取包含有关 3000 部电影的各种信息的数据框，然后计算每种类型的平均总收入。我是 R 的新手，我已经阅读了此处与 ddply 相关的所有问题，但我似乎仍然无法理解。这是我现在所拥有的:

> attach(movies)
> ddply(movies, Genre, mean(Gross))
Error in llply(.data = .data, .fun = .fun, ..., .progress = .progress,  : 
.fun is not a function.

我应该如何编写一个函数，该函数取每组电影的“总”列中的值的平均值，按类型分组？我知道这似乎是一个简单的问题，但文档对我来说真的很困惑，而且我对 R 语法还不太熟悉。

除了 ddply 之外，还有其他方法可以使这更容易吗？

谢谢!!

最佳答案

这是使用 ggplot2 中可用的提示数据集的示例

library(ggplot2);
mean_tip_by_day = ddply(tips, .(day), summarize, mean_tip = mean(tip/total_bill))

希望这是有用的

关于R:使用 ddply 将函数应用于数据子集，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/5208992/

上一篇：.NET 代码访问安全性 - 为什么很少使用？

下一篇：asp.net - 具有管道模式的 IIS 7.0 = 集成不会在 ASP .NET 中加载任何图像/css

相关文章：

r - dplyr:将函数table()应用于data.frame的每一列

R排序汇总ddply按组总和

python - 黑盒脚本执行？

r - 为什么 colSums(x, na.rm = T) 中出现错误 : invalid 'na.rm' argument in R

r - 是否有必要在 R 包中导出基本方法扩展？文档影响？

r - 错误 : only defined on a data frame with all numeric variables with ddply on large dataset

r - 获取 R 中多个变量/列的分类因素计数

R ddply 仅汇总选定/特定/逻辑行的总和

r - 在 igraph 中投影二分网络时出现内存不足错误

重构任意嵌套列表