删除重复的组 dplyr r

标签 r dataframe dplyr group-by

我有以下数据框:

df <- structure(list(GENE= c("ENS1", "ENS2", 
"ENS3", "ENS4", "ENS1",  "ENS2", "ENS3"), group= c(1L, 
1L, 1L, 2L, 3L, 3L, 3L)), 
class = "data.frame", row.names = c(NA, -7L))

GENE  group
ENS1  1
ENS2  1
ENS3  1
ENS4  2
ENS1  3
ENS2  3
ENS3  3
由于第 1 组和第 3 组相同,我想删除其中之一。
我怎样才能做到这一点?
谢谢

最佳答案

使用 stack 的基本 R 选项+ unstack + duplicated

setNames(
    type.convert(
        stack((u <- unstack(df))[!duplicated(u)]),
        as.is = TRUE
    ), names(df)
)
这使
  GENE group
1 ENS1     1
2 ENS2     1
3 ENS3     1
4 ENS4     2

关于删除重复的组 dplyr r,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68391401/

相关文章:

python - Pandas 中的逻辑多重索引

python - 如何将 Pandas 数据框的索引转换为列

r - 延迟评估、dplyr "filter"和 NA

r - 如何使用更快的 R 脚本从 .sam 文件生成假发文件?

r - 用户定义的函数作为公式输入

具有非重复二项式的 R data.frame

r - 向数据框中添加新列并使用特定逻辑中的值填充行

r - dplyr inner_join 与字符列上的 NA

r - 如何在包中使用 data.table 而不导入所有函数?

r - 条件面板和选择输入