如果我正在处理一个数据集并且我想对数据进行分组(即通过 country
),计算汇总统计量( mean()
),然后计算 ungroup()
data.frame
要拥有一个具有原始维度 ( country
- year
) 的数据集和一个列出每个国家/地区平均值的新列(重复 n 年),我将如何使用 dplyr
? ungroup()
函数不返回 data.frame
原始尺寸:
gapminder %>%
group_by(country) %>%
summarize(mn = mean(pop)) %>%
ungroup() # returns data.frame with nrows == length(unique(gapminder$country))
最佳答案
ungroup()
如果你想做类似的事情,这很有用
gapminder %>%
group_by(country) %>%
mutate(mn = pop/mean(pop)) %>%
ungroup()
您希望使用整个组的统计数据进行某种转换。在上面的例子中,
mn
是人口与组平均人口的比率。当它被取消分组时,任何进一步调用它的突变都不会使用分组进行聚合统计。summarize
自动减小尺寸,并且没有办法恢复它。也许你想做gapminder %>%
group_by(country) %>%
mutate(mn = mean(pop)) %>%
ungroup()
其中创建
mn
作为每个组的平均值,为该组内的每一行复制。
关于r - 解释 dplyr 中的 ungroup(),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48446816/