我有以下数据框:
df <- structure(list(GENE= c("ENS1", "ENS2",
"ENS3", "ENS4", "ENS1", "ENS2", "ENS3"), group= c(1L,
1L, 1L, 2L, 3L, 3L, 3L)),
class = "data.frame", row.names = c(NA, -7L))
GENE group
ENS1 1
ENS2 1
ENS3 1
ENS4 2
ENS1 3
ENS2 3
ENS3 3
由于第 1 组和第 3 组相同,我想删除其中之一。我怎样才能做到这一点?
谢谢
最佳答案
使用 stack
的基本 R 选项+ unstack
+ duplicated
setNames(
type.convert(
stack((u <- unstack(df))[!duplicated(u)]),
as.is = TRUE
), names(df)
)
这使 GENE group
1 ENS1 1
2 ENS2 1
3 ENS3 1
4 ENS4 2
关于删除重复的组 dplyr r,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68391401/