我正在尝试使用 ddply 方法获取包含有关 3000 部电影的各种信息的数据框,然后计算每种类型的平均总收入。我是 R 的新手,我已经阅读了此处与 ddply 相关的所有问题,但我似乎仍然无法理解。这是我现在所拥有的:
> attach(movies)
> ddply(movies, Genre, mean(Gross))
Error in llply(.data = .data, .fun = .fun, ..., .progress = .progress, :
.fun is not a function.
我应该如何编写一个函数,该函数取每组电影的“总”列中的值的平均值,按类型分组?我知道这似乎是一个简单的问题,但文档对我来说真的很困惑,而且我对 R 语法还不太熟悉。
除了 ddply 之外,还有其他方法可以使这更容易吗?
谢谢!!
最佳答案
这是使用 ggplot2 中可用的提示数据集的示例
library(ggplot2);
mean_tip_by_day = ddply(tips, .(day), summarize, mean_tip = mean(tip/total_bill))
希望这是有用的
关于R:使用 ddply 将函数应用于数据子集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5208992/