regex - 查找重复项(正则表达式)

标签 regex csv match

我有一个 CSV,其中包含 500 名成员及其电话号码的列表。我尝试了 diff 工具,但似乎没有一个能找到重复项。

我可以使用正则表达式按成员(member)电话号码查找重复行吗?

我在 Mac 上使用 Textmate。

非常感谢

最佳答案

您要搜索哪些重复项?整条线路还是只是同一个电话号码?

如果是整行,那么试试这个:

sort phonelist.txt | uniq -c | sort -n

您将在底部看到多次出现的所有行。

如果只是某列中的电话号码,则使用:

awk -F ';' '{print $4}' phonelist.txt | uniq -c | sort -n

将“4”替换为电话号码和“;”列的编号与您在文件中使用的真实分隔符。

或者给我们一些来自该文件的示例行。

编辑:

如果数据格式为:name,mobile,phone,uniqueid,group,则使用以下内容:

awk -F ',' '{print $3}' phonelist.txt | uniq -c | sort -n

在命令行中。

关于regex - 查找重复项(正则表达式),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3804485/

相关文章:

python - 如何按从高到低对字母数字列表进行排序(Python)

regex - * Perl 6 中的量词

java - 在 Java 中使用 RegEx 验证名字和姓氏

javascript - 替换另外 2 个符号之间的所有符号

java - Java 中的正则表达式

Java:使用正则表达式查找 URL 将它们转换为 html 链接。同时检测链接是否包含http://,如果没有,追加它

regex - 如何在替换中使用变量作为修饰符

python - 在 Pandas DataFrame 中拆分列表

R 清理 csv 文件

python - 检查两个 csv 文件的两列值,如果找到匹配,则写入另一个 csv 文件