r - 如何从R中的数据框中删除重复的行

标签 r

如何从数据框中删除重复的行

  Area    Population
GOMBAK       668,694
GOMBAK       668,694
GOMBAK       668,694
  Batu       285,288
  Batu       285,288
 KLANG       842,146
 KLANG       842,146

成为

GOMBAK    668,694
  Batu    285,288 
 KLANG     842,14

最佳答案

尝试使用duplicate()函数:

df <- data.frame(Area=c("GOMBAK", "GOMBAK", "GOMBAK", "Batu", "Batu", "KLANG", "KLANG"),
                 Population=c(668694, 668694, 668694, 285288, 285288, 842146, 842146))
df <- df[!duplicated(df), ]

> df
    Area Population
1 GOMBAK     668694
4   Batu     285288
6  KLANG     842146

如果你想计算总体总和,那么以下应该可以工作:

sum(as.numeric(levels(df$Population)))

有必要使用水平,因为根据您在评论中提到的内容,您的人口列是一个因素

关于r - 如何从R中的数据框中删除重复的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31933605/

相关文章:

R:对数据框的多列进行行式计算的最快方法

r - R 中列表的总和元素 - For

正则表达式在 R 中查找特定模式

r - ggplot2:格式化图例类别

r - 在不使用任何包的情况下在 R 中绘制 ROC 曲线

通过将列名连接到行,将一个表中的缺失值替换为另一表中的值

r - 将字符串的一部分转换为大写(或小写)

r - 用于生成预测的 Plyr

r - pivot_longer 与组和删除列名前缀

r - R data.table 中带有阈值窗口的累积和