r - R 中的多次重复(2 次、3 次、...)

标签 r duplicates duplicate-data

搜索了一段时间,我知道这个问题还没有得到解答。假设我有以下向量
v <- c("a", "b", "b", "c","c","c", "d", "d", "d", "d")
我如何找到重复次数超过 1 次的那些值

(应该是 "c","c","c", "d", "d", "d", "d")
和超过 2 个重复

(应该是 "d", "d", "d", "d" )

功能 duplicated(v)只返回有重复的值。

最佳答案

您可以生成一个 table()然后检查v的哪些元素是表的相关子集的一部分,例如

R> v <- c("a", "b", "b", "c","c","c", "d", "d", "d", "d")
R> tab <- table(v)
R> tab
v
a b c d 
1 2 3 4 
R> v[v %in% names(tab[tab > 2])]
[1] "c" "c" "c" "d" "d" "d" "d"
R> v[v %in% names(tab[tab > 3])]
[1] "d" "d" "d" "d"

关于r - R 中的多次重复(2 次、3 次、...),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29973061/

相关文章:

SQL:删除重复记录 - 尽管类型不同

java - Spring Integration 并行处理,无需聚合

r - 使用 R data.table 对高频时间序列进行子集化(用 data.table 替换 xts 功能)

r - 计算加权平均值和标准差

sql - 从没有唯一键的表中删除重复行

python - 如何从列表中删除连续的重复项?

r - 如何将参数传递给引用嵌套数据帧的列名的 purrr:::map ?

r - 向 RgoogleMaps 图添加点

sql - 插入多行时重复项会发生什么情况?

java - 如何识别从多个提要中收集的重复项并将其链接到数据库中