我想使用 parquet-tools-1.8.1.jar 仅转储某些文本文件中的特定列。但无法这样做。我正在尝试以下命令。请注意我的列名有正斜杠。
parquet-tools-1.8.1.jar dump --column 'dir1/log1/job12121' '/hdfs-path/to/parquet file with space.parquet' > /home/local/parquet/output.text
最佳答案
运行
hadoop jar parquet-tools-1.8.1.jar parquet.tools.Main dump --column 'dir1/log1/job12121' '/hdfs-path/to/parquet file with space.parquet' > /home/local/parquet/output.text
关于hadoop - 使用 Parquet-tools.jar 从 Parquet 文件转储特定列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38478383/