r - 解释 dplyr 中的 ungroup()

标签 r dplyr

如果我正在处理一个数据集并且我想对数据进行分组(即通过 country ),计算汇总统计量( mean() ),然后计算 ungroup() data.frame要拥有一个具有原始维度 ( country - year ) 的数据集和一个列出每个国家/地区平均值的新列(重复 n 年),我将如何使用 dplyr ? ungroup()函数不返回 data.frame原始尺寸:

gapminder %>%
    group_by(country) %>%
    summarize(mn = mean(pop)) %>%
    ungroup() # returns data.frame with nrows == length(unique(gapminder$country))

最佳答案

ungroup()如果你想做类似的事情,这很有用

gapminder %>%
group_by(country) %>%
mutate(mn = pop/mean(pop)) %>%
ungroup() 

您希望使用整个组的统计数据进行某种转换。在上面的例子中,mn是人口与组平均人口的比率。当它被取消分组时,任何进一步调用它的突变都不会使用分组进行聚合统计。
summarize自动减小尺寸,并且没有办法恢复它。也许你想做
gapminder %>%
group_by(country) %>%
mutate(mn = mean(pop)) %>%
ungroup() 

其中创建 mn作为每个组的平均值,为该组内的每一行复制。

关于r - 解释 dplyr 中的 ungroup(),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48446816/

相关文章:

r - 用 R 对表格进行排序

r - fread 系统区域设置错误

mysql - 尝试将 R 与 MySQL : The used command is not allowed with this MySQL version 一起使用

r - 从数据表中分离变量并创建新的数据表

r - 如何在整个 data.frame 中搜索字符串

r - 如何(快速)从 lme4 中的 lmer 模型中提取 t 值?

r - 负选择数据框后如何在R中获取汇总统计信息

r - 计算 `dplyr` 管道中的累积概率(Kaplan-Meier 生存函数)

r - 使用 tidyverse 计算复杂的差异分数?

r - 计算第一个和最后一个出现的数字之间的NA