是否有任何工具或实用程序可以检查 HDFS 文件是否是 textfile
还是二进制文件,例如 avro
、ORC
等?
我无法回复文件扩展名。我不想知道确切的类型。我只需要知道数据是否可读。
最佳答案
让我们bash
它
hdfs dfs -cat /file/on/hdfs | head -15 > tmp ; file -i tmp ; rm tmp
对于诸如 parquet
等不可读的文件,您将得到:
tmp: application/octet-stream; charset=binary
关于file - 如何检查HDFS文件是否包含二进制数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43893675/