linux - 在 linux 中,如何仅按文件名比较两个目录并获取不匹配的结果列表

标签 linux bash list comparison diff

我想知道如何仅通过文件名(忽略扩展名)来比较两个目录(不是递归地)以获得差异。例如,如果我有列表 A 和 B,我想知道 A 中有什么,B 中没有。

我目前正在处理一些图像。在一个目录中,我有扩展名为 .tiff 的源文件,在另一个目录中,我已经处理了扩展名为 .png 的文件。两个目录中的文件名相同,只是扩展名不同(例如,一个文件在目录 A 中名为 foo.tiff,在目录 B 中名为 foo.png)。

我正在尝试查找尚未处理的文件。

谢谢!

最佳答案

首先让我们创建一个辅助函数:

getfiles() { find "$1" -maxdepth 1 -type f -exec bash -c 'for f in "$@"; do basename "${f%.*}"; done' "" {} + | sort; }

如果你运行 getfiles dirname , 它将返回该目录中的文件的排序列表,没有目录名称,也没有任何扩展名。 -maxdepth 1选项意味着 find不会递归搜索。

现在,让我们比较文件目录AB :

diff <(getfiles A) <(getfiles B)

输出是通常的diff格式。由于可以使用 diff 的任何常规选项,因此输出格式非常灵活。

例子

这是一个示例目录 AB , 每个都有一个文件,另一个没有:

$ ls */
A/:
bar.png  foo.png  qux.png

B/:
bar.tiff  baz.tiff  foo.tiff

输出:

$ diff <(getfiles A) <(getfiles B)
1a2
> baz
3d3
< qux

输出正确识别 (a) B有一个 baz A 中不存在的文件和 (b) A有一个 qux B 中不存在的文件.

替代输出

假设我们只想做一个单方面的比较,找到B里面有哪些文件也不在 A 中.在这种情况下,grep可以使用:

$ grep -vxFf <(getfiles A) <(getfiles B)
baz

这里使用的选项是:

  • -v告诉grep排除匹配行

  • -x告诉grep只匹配整行

  • -F告诉grep模式是固定字符串,而不是正则表达式。

  • -f告诉grep从文件或类似文件的对象中获取模式列表 <(getfiles A) .

包含空格的文件和目录名称示例

考虑这些文件:

$ ls */
A A/:
1 bar.png  1 foo.png  1 qux.png

B B/:
1 bar.tiff  1 baz.tiff  1 foo.tiff

输出:

$ diff <(getfiles 'A A') <(getfiles 'B B')
1a2
> 1 baz
3d3
< 1 qux

或者,

$ grep -vxFf <(getfiles 'A A') <(getfiles 'B B')
1 baz

限制

如果您的任何文件名中有换行符,这将给出不正确的结果。至少对于 grep形式,这可以扩展到更一般的情况。

关于linux - 在 linux 中,如何仅按文件名比较两个目录并获取不匹配的结果列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26935515/

相关文章:

git - 运行docker命令时出现bash语法错误

python - 如何将字符串列表转换为每个元素都是其核心类型的新列表?

linux - linux 命令中的管道不工作。

c++ - 将光标移动到控制台的左下方

linux - 如何确定 Rust 中进程的有效用户 ID?

linux - 如何在 Linux 中使用 sed 将控制字符 ^@ 插入到文件中?

linux - 将重复值重定向到新文件

bash - 如何从 bash 中的 “keytool” 命令中删除警告

c# - 从 C# 中的列表中完全删除所有至少有一个重复项的元素

Python 有序列表搜索与对象列表搜索集