pig 脚本输出了一些带有 .pig_header 和 .pig_schema 的部分文件(part-m-00000、part-m-00001 等),我正在尝试将它们作为一个输出 csv 加入。 我尝试使用hadoop合并
hadoop fs -getmerge ./output output.csv
但这些文件也与 .pig_schema 文件合并,因此它变得类似于
header1,header2,header3
{"fields":[{"name": "header1", "type":...}]}
value1,value2,value3
在不包含 .pig_schema 的情况下如何正确加入它们?
谢谢!
最佳答案
使用文件团:hadoop fs -getmerge ./output/part* output.csv
关于java - 如何加入Pig输出文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22151378/