在跨多行的文件中查找重复/重复或唯一词

标签 find duplicates

在Linux中,我有一个文本文件,其中包含重复的单词,例如

abc line 1
xyz zzz
123 456
abc end line

现在我只想打印所有重复的单词(即abc)
如何 ?

最佳答案

您可以使用grep -wo标记单词,并使用uniq -d查找连续的重复项,添加-c以计算重复项的数量,例如:

grep -wo '[[:alnum:]]\+' infile | sort | uniq -cd

输出:
2 abc
2 line

关于在跨多行的文件中查找重复/重复或唯一词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22034240/

相关文章:

eclipse 发现资源未编译

regex - 使用 bash 计算子树中特定目录的数量

Linux: 'ls' 所有jpg文件在csv中递归

PHP 如何在复制字符串中的每个字符后将字符串变为 "unduplicate"(还原字符串)

insert - 插入时 DB2 重复键错误,但在选择计数(*)后工作

sql - 删除重复的 SQL 记录

linux - bash find -exec 有时有效,有时无效

svn - 在机器上找到所有颠覆工作副本

php - Insert Into on Duplicate Update 给我创建了一个不需要的行

jQuery 比较 Div 内容并删除任何重复数据