庆典,Linux : Set difference between two text files

标签 bash file-io set-difference

我有两个文件 A-nodes_to_deleteB-nodes_to_keep。每个文件都有很多带有数字 ID 的行。

我想获得 nodes_to_delete 但不在 nodes_to_keep 中的数字 ID 列表,即 A\B

在 PostgreSQL 数据库中执行此操作非常慢。有什么巧妙的方法可以使用 Linux CLI 工具在 bash 中执行此操作?

更新:这似乎是一个 Pythonic 的工作,但文件确实非常大。我已经使用 uniqsort 和一些集合论技术解决了一些类似的问题。这比等效的数据库快两到三个数量级。

最佳答案

comm命令执行此操作。

关于庆典,Linux : Set difference between two text files,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2509533/

相关文章:

bash - 我如何在 Bash 中显示事物树?

linux - 列出最近 5 个隐藏目录的内容

javascript - 应用程序重新启动后追加到文件 - Phonegap

java - 文件未在 jar 文件内的 java 中打开

R - 数据框中两组之间的差异

linux - 使用 lsof 检查文件是否打开

python - 打印语句仅出现在子进程调用之前或之后

c++ - 查找集合键和映射键之间的 set_difference

r - 捕获 R 中两个数据帧之间的匹配和不匹配值

linux - Spark-submit 在错误的目录中查找