如何从数据框中删除重复的行
Area Population
GOMBAK 668,694
GOMBAK 668,694
GOMBAK 668,694
Batu 285,288
Batu 285,288
KLANG 842,146
KLANG 842,146
成为
GOMBAK 668,694
Batu 285,288
KLANG 842,14
最佳答案
尝试使用duplicate()
函数:
df <- data.frame(Area=c("GOMBAK", "GOMBAK", "GOMBAK", "Batu", "Batu", "KLANG", "KLANG"),
Population=c(668694, 668694, 668694, 285288, 285288, 842146, 842146))
df <- df[!duplicated(df), ]
> df
Area Population
1 GOMBAK 668694
4 Batu 285288
6 KLANG 842146
如果你想计算总体总和,那么以下应该可以工作:
sum(as.numeric(levels(df$Population)))
有必要使用水平
,因为根据您在评论中提到的内容,您的人口列是一个因素
。
关于r - 如何从R中的数据框中删除重复的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31933605/