r - 按多个组对特定行求和

我有一个如下所示的数据框...

df <- data.frame(row.names = c(1,2,3,4,5,6,7,8), Week = c(1,1,2,2,52,52,53,53), State = c("Florida", "Georgia","Florida", "Georgia","Florida", "Georgia","Florida", "Georgia"), Count_2001 = c(25,16,83,45,100,98,22,34), Count_2002 = c(3, 78, 22, 5, 78, 6, 88, 97))

我现在正在尝试操作此数据集，以便在所有计数列中仅将列表中每个州的第 52 周和第 53 周汇总在一起。类似于这个例子.. GROUP BY for specific rows

新数据集应将这些行加在一起，为每个州创建新的第 52 周行，如下例...

df2 <- data.frame(row.names = c(1,2,3,4,5,6), Week = c(1,1,2,2,52,52), State = c("Florida", "Georgia","Florida", "Georgia","Florida", "Georgia"), Count_2001 = c(25,16,83,45,122,132), Count_2002 = c(3, 78, 22, 5, 166, 103))

在 R 中有一个简单的解决方案吗？

最佳答案

将您的 53s 更改为 52s 并按组求和:

library(dplyr)
df %>%
  mutate(Week = case_when(Week == 53 ~ 52, TRUE ~ Week)) %>%
  group_by(State, Week) %>%
  summarize(across(everything(), sum))
# # A tibble: 6 x 4
# # Groups:   State [2]
#   State    Week Count_2001 Count_2002
#   <chr>   <dbl>      <dbl>      <dbl>
# 1 Florida     1         25          3
# 2 Florida     2         83         22
# 3 Florida    52        122        166
# 4 Georgia     1         16         78
# 5 Georgia     2         45          5
# 6 Georgia    52        132        103

关于r - 按多个组对特定行求和，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/63996019/

上一篇：python - 带有 numpy 数组的条件循环

下一篇：python-3.x - Pandas 正则表达式提取两个不同符号前后的所有内容

相关文章：

r - 为什么在 rmarkdown 中循环时数据表不打印？

r - 如何调整图表中的轴标签？

python - 加快 Pandas 中自回归项的创建？

mysql:简化请求 - 按多字段分组

mysql - 选择mysql中每个ID的第二行

r - 将 POLYGON 聚合为 MULTIPOLYGON 并保留 data.frame

r - 使用 brew/whisker 进行错误安全模板

r - 忽略 NA 进行分组

python - pandas 比应用 lambda 更快的方式在每一行应用逻辑？

mysql - 使用连接表进行分组并计算总和