hadoop - 映射器将值传递给不同的映射器-缩减器

标签 hadoop mapreduce

我有两个阶段的 map-reduce hadoop 程序。 (映射器 1、 reducer 1、映射器 2、 reducer 2)。我可以将一些 mapper1 键值直接传递给 reducer1 并将其他一些键值直接传递给 mapper2 吗?

最佳答案

您可以让 mapper 为您希望 reducer1 处理的那些设置键值,而让那些转到 mapper2 的键值有一些任意的键名(让我们在类 Text.class 中任意说“TO_MAPPER_2”) .然后你的 reducer 代码在 if 语句中,这样它只在键不是“TO_MAPPER_2”时执行。这将确保您的值不会被 reducer 处理,并且将通过您用来将它们发送到那里的任何方法不变地到达 mapper2。

关于hadoop - 映射器将值传递给不同的映射器-缩减器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20140594/

相关文章:

hadoop - 使用 ambari 删除服务时出错

hadoop - 在Pig Latin中无法使用FOREACH读取变体

java - 如何设计一个特殊的MapReduce倒排索引?

hadoop - 当 reducer 仍在运行时,我可以读取 reducer 输出吗?

java - 用另一个方法替换作业类中的方法 waitForCompletion()

SQL Hive 子查询错误

hadoop - 更改 pig latin 中列的数据类型

hadoop - 不寻常的 Hadoop 错误 - 任务自行终止

logging - 如何在控制台上抑制 Hadoop 日志消息

mapreduce - 我的数据结构和查询在 RavenDB 中可行吗?