hadoop - oozie 中的 org.apache.hadoop.mapred.lib.MultipleOutputs.addNamedOutput()

标签 hadoop mapreduce hadoop2 mapper reducers

我正在尝试使用 MultipleOutputs 来更改 reducer 中的输出文件名。我正在使用 oozie 工作流来运行 mapreduce 作业。

我找不到在 oozie 工作流中添加以下属性的方法 -

MultipleOutputs.addNamedOutput(job, "text", TextOutputFormat.class, Text.class, Text.class);

因为它是 oozie mapreduce 操作,所以我没有驱动程序类放在上面的代码。

最佳答案

答案就在方法的源代码中。 来自hadoop core 1.2.1 jar

/*     */   public static void addNamedOutput(Job job, String namedOutput, Class<? extends OutputFormat> outputFormatClass, Class<?> keyClass, Class<?> valueClass)
/*     */   {
/* 248 */     checkNamedOutputName(job, namedOutput, true);
/* 249 */     Configuration conf = job.getConfiguration();
/* 250 */     conf.set("mapreduce.multipleoutputs", conf.get("mapreduce.multipleoutputs", "") + " " + namedOutput);
/*     */     
/* 252 */     conf.setClass("mapreduce.multipleoutputs.namedOutput." + namedOutput + ".format", outputFormatClass, OutputFormat.class);
/*     */     
/* 254 */     conf.setClass("mapreduce.multipleoutputs.namedOutput." + namedOutput + ".key", keyClass, Object.class);
/* 255 */     conf.setClass("mapreduce.multipleoutputs.namedOutput." + namedOutput + ".value", valueClass, Object.class);
/*     */   }

因此,它指向再次设置 "mapreduce.multipleoutputs",使用空格分隔 namedOutput 并使用以下变量设置格式、键和值类。

"mapreduce.multipleoutputs.namedOutput." + namedOutput + ".format"
"mapreduce.multipleoutputs.namedOutput." + namedOutput + ".key"
"mapreduce.multipleoutputs.namedOutput." + namedOutput + ".value"

希望对您有所帮助。

关于hadoop - oozie 中的 org.apache.hadoop.mapred.lib.MultipleOutputs.addNamedOutput(),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49858219/

相关文章:

xml - 在 Hive 上使用 XPATH 获取 XML 节点的名称

java - 元组作为 Hadoop 映射器中的键

caching - 读取文件内容时出错-MapReduce

java - 如何在Hadoop上模拟运行一些服务器?

hadoop - 使用启用了推测执行的 Hadoop 多输出写入多个输出

java - 消息 : Invalid byte 1 of 1-byte UTF-8 sequence in hadoop

hadoop - 在EC2(最好是Mapr)上使用hadoop的最简单方法是什么

hadoop - CDH 网络接口(interface)速度抑制

hadoop - 什么是本地DataNode?

hadoop - Hive托管表与外部表的可维护性