我想将 hdfs 文件与 unix 文件进行比较。我知道使用 cat 命令来比较文件的一种方法,因为 Hadoop 分布式文件系统 (HDFS) 也提供了 cat 命令。
让我们举一个例子:
# hdfs dfs -ls -R /demo
-rw-r--r-- 3 root hdfs 129617 2014-10-17 12:22 /demo/abc.log
#ls /tmp
xyz.log
在这里我想将abc.log
与xyz.log
进行比较。还有更好的方法吗?
最佳答案
您可能可以使用 shell 重定向 + diff。
diff <(hdfs dfs -cat /demo/abc.log) <(cat /tmp/xyz.log)
关于python - 如何比较hdfs文件和unix文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26430844/