在Linux中,我有一个文本文件,其中包含重复的单词,例如
abc line 1
xyz zzz
123 456
abc end line
现在我只想打印所有重复的单词(即abc)
如何 ?
最佳答案
您可以使用grep -wo
标记单词,并使用uniq -d
查找连续的重复项,添加-c
以计算重复项的数量,例如:
grep -wo '[[:alnum:]]\+' infile | sort | uniq -cd
输出:
2 abc
2 line
关于在跨多行的文件中查找重复/重复或唯一词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22034240/