hadoop - 如何配置 Avro MapReduce 作业以将结果输出到单个文件中？

我有一个三节点集群，当 Avro 作业完成时，它会创建三个输出文件(拆分文件)，但是，我只想输出一个文件。有什么建议吗？

最佳答案

设置mapred.reduce.tasks=1，但这可能会增加执行时间。

您也可以在作业结束后使用 hadoop -getmerge 命令获取单个文件。

关于hadoop - 如何配置 Avro MapReduce 作业以将结果输出到单个文件中？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24633078/

相关文章：

java - Java进程故障(hadoop，hbase)