python - 如何比较hdfs文件和unix文件?

标签 python linux shell hadoop hdfs

我想将 hdfs 文件与 unix 文件进行比较。我知道使用 cat 命令来比较文件的一种方法,因为 Hadoop 分布式文件系统 (HDFS) 也提供了 cat 命令。

让我们举一个例子:

# hdfs dfs -ls -R /demo

-rw-r--r--   3 root hdfs     129617 2014-10-17 12:22 /demo/abc.log

#ls /tmp
xyz.log

在这里我想将abc.logxyz.log进行比较。还有更好的方法吗?

最佳答案

您可能可以使用 shell 重定向 + diff。

diff <(hdfs dfs -cat /demo/abc.log) <(cat /tmp/xyz.log)

关于python - 如何比较hdfs文件和unix文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26430844/

相关文章:

shell - 自定义 shell 自动从 .emacs 启动

python - Slug 太短了 - Django

python - 从 Python 调用 cpp 函数时出现段错误

linux - 如何在 Linux shell 上关闭打开(已删除)的文件描述符

linux - 如何在 Qt 的 linux 终端上禁用警告和调试输出

python - 具有 shutil 模块的最低版本的 Python 是什么?

shell - 使用 ssh 远程加 grep

python - Numba:使用具有默认值的参数调用具有显式签名的 jit

python - 禁用或锁定文本编辑 PyQT

linux - Hash ("#") symbol in/etc/environment 导致字符串被拆分