linux - 唯一编号 : only when different by more than 1 character OR case

标签 linux sorting uniq

我得到了一个包含很多名字的文本文件。 我想要一个所有字符串(行)的列表 1) CASE 不同(即 audi vs AuDI) 2) 相差超过 1 个字符即 (mygoo VS my-goo) 有什么想法吗??

最佳答案

你真的是说超过 1 个字符的区别?它会匹配所有单词,不是吗?

如果你的意思是至多X个差异,你可以使用agrep模糊搜索。

例如跟随/tmp/list

bar
foobar
fooBar
foo-bar
foo--bar
spam
toolbar

命令

$ agrep -1 foobar /tmp/list

会发现:

foobar
fooBar
foo-bar

(它包括原始模式,您可以将其过滤掉,例如附加 | grep -v '^foobar$')

更新

这是一个关于工具的提示,您可以使用它,它可能不是您想要的。请同时查看 -i agrep 选项

关于linux - 唯一编号 : only when different by more than 1 character OR case,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4049783/

相关文章:

linux - 如何根据文件中的最少行数删除前 X 行

linux - Xen 无法在 Centos 7 上启动

mysql - SQL:按rowID排序,然后根据rowid按列排序

javascript - 我如何按 ABC 对名称的 javascript.map 数组进行排序

linux - 一起使用 linux 命令 "sort -f | uniq -i"忽略大小写

python - 在 heroku 中启动应用程序?什么是程序文件? 'web:' 命令?

c++ - 在哪里可以找到 arm-linux-gnueabihf-ld 的联机帮助页,更不用说编写良好的联机帮助页了,其中包括 -rpath 和 -rpath-link?

r - 按特定(自定义)顺序对整数向量进行排序

perl - 从 HoA 值中获取独特的元素并打印

bash - 为列的每个唯一值输出整行一次(Bash)