hadoop - 如何配置 Avro MapReduce 作业以将结果输出到单个文件中?

标签 hadoop mapreduce bigdata avro

我有一个三节点集群,当 Avro 作业完成时,它会创建三个输出文件(拆分文件),但是,我只想输出一个文件。有什么建议吗?

最佳答案

设置mapred.reduce.tasks=1,但这可能会增加执行时间。

您也可以在作业结束后使用 hadoop -getmerge 命令获取单个文件。

关于hadoop - 如何配置 Avro MapReduce 作业以将结果输出到单个文件中?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24633078/

相关文章:

java - Java进程故障(hadoop,hbase)

database - 聊天/对话数据库

java - 错误 : java. lang.ClassNotFoundException : org. apache.hadoop.hbase.HBaseConfiguration 使用 javac 编译

apache-spark - Apache Spark ALS 建议方法

hadoop - 无法通过 -kill 命令终止 oozie 作业

java - Hadoop 作业返回异常 "classNotFound"

hadoop - 什么时候我们不在 Mapreduce 中使用 Combiner?

java - 工作完成后,如何以编程方式关闭剩余的mapreduce拆分

database - HDFS 与 NoSQL (HBASE),它是如何工作的?

apache - 使用 Hadoop YARN 在本地模式下运行 Hive 查询