我想知道如何仅通过文件名(忽略扩展名)来比较两个目录(不是递归地)以获得差异。例如,如果我有列表 A 和 B,我想知道 A 中有什么,B 中没有。
我目前正在处理一些图像。在一个目录中,我有扩展名为 .tiff 的源文件,在另一个目录中,我已经处理了扩展名为 .png 的文件。两个目录中的文件名相同,只是扩展名不同(例如,一个文件在目录 A 中名为 foo.tiff,在目录 B 中名为 foo.png)。
我正在尝试查找尚未处理的文件。
谢谢!
最佳答案
首先让我们创建一个辅助函数:
getfiles() { find "$1" -maxdepth 1 -type f -exec bash -c 'for f in "$@"; do basename "${f%.*}"; done' "" {} + | sort; }
如果你运行 getfiles dirname
, 它将返回该目录中的文件的排序列表,没有目录名称,也没有任何扩展名。 -maxdepth 1
选项意味着 find
不会递归搜索。
现在,让我们比较文件目录A
和 B
:
diff <(getfiles A) <(getfiles B)
输出是通常的diff
格式。由于可以使用 diff 的任何常规选项,因此输出格式非常灵活。
例子
这是一个示例目录 A
和 B
, 每个都有一个文件,另一个没有:
$ ls */
A/:
bar.png foo.png qux.png
B/:
bar.tiff baz.tiff foo.tiff
输出:
$ diff <(getfiles A) <(getfiles B)
1a2
> baz
3d3
< qux
输出正确识别 (a) B
有一个 baz
A
中不存在的文件和 (b) A
有一个 qux
B
中不存在的文件.
替代输出
假设我们只想做一个单方面的比较,找到B
里面有哪些文件也不在 A
中.在这种情况下,grep
可以使用:
$ grep -vxFf <(getfiles A) <(getfiles B)
baz
这里使用的选项是:
-v
告诉grep
排除匹配行-x
告诉grep
只匹配整行-F
告诉grep
模式是固定字符串,而不是正则表达式。-
-f
告诉grep
从文件或类似文件的对象中获取模式列表<(getfiles A)
.
包含空格的文件和目录名称示例
考虑这些文件:
$ ls */
A A/:
1 bar.png 1 foo.png 1 qux.png
B B/:
1 bar.tiff 1 baz.tiff 1 foo.tiff
输出:
$ diff <(getfiles 'A A') <(getfiles 'B B')
1a2
> 1 baz
3d3
< 1 qux
或者,
$ grep -vxFf <(getfiles 'A A') <(getfiles 'B B')
1 baz
限制
如果您的任何文件名中有换行符,这将给出不正确的结果。至少对于 grep
形式,这可以扩展到更一般的情况。
关于linux - 在 linux 中,如何仅按文件名比较两个目录并获取不匹配的结果列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26935515/