我有以下数据集:
Mark Model Sold
1 Toyota Yaris 7739
2 Dacia Duster 5798
3 Toyota Corolla 4010
4 Toyota RAV4 3258
5 Skoda Fabia 3197
6 Fiat Tipo 3157
7 Skoda Octavia 3017
我需要一个公式来计算重复的标记和已售出的总量,以获得如下所示的结果:
Mark Model Sold
1 Toyota 3 15007
2 Dacia 1 5798
3 Skoda 2 6214
4 Fiat 1 3157
有人可以帮我吗?
最佳答案
library(dplyr)
df %>% group_by(Mark) %>% summarise(Model = n(), Sold = sum(Sold))
df
是您的数据集。
关于具有重复项的非数字列的 R 求和值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65751478/