r - 如何从R中的数据框中删除重复的行

标签 r

如何从数据框中删除重复的行

  Area    Population
GOMBAK       668,694
GOMBAK       668,694
GOMBAK       668,694
  Batu       285,288
  Batu       285,288
 KLANG       842,146
 KLANG       842,146

成为

GOMBAK    668,694
  Batu    285,288 
 KLANG     842,14

最佳答案

尝试使用duplicate()函数:

df <- data.frame(Area=c("GOMBAK", "GOMBAK", "GOMBAK", "Batu", "Batu", "KLANG", "KLANG"),
                 Population=c(668694, 668694, 668694, 285288, 285288, 842146, 842146))
df <- df[!duplicated(df), ]

> df
    Area Population
1 GOMBAK     668694
4   Batu     285288
6  KLANG     842146

如果你想计算总体总和，那么以下应该可以工作:

sum(as.numeric(levels(df$Population)))

有必要使用水平，因为根据您在评论中提到的内容，您的人口列是一个因素。

关于r - 如何从R中的数据框中删除重复的行，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31933605/

上一篇：xml - 在 vb/net 中读取 XML 文件时出现 System.IO.FileNotFoundException

下一篇：从草地 gis 导出多个栅格

相关文章：

r - 在不使用任何包的情况下在 R 中绘制 ROC 曲线

通过将列名连接到行，将一个表中的缺失值替换为另一表中的值

r - 将字符串的一部分转换为大写(或小写)

r - 用于生成预测的 Plyr

r - pivot_longer 与组和删除列名前缀

r - R data.table 中带有阈值窗口的累积和