hadoop - 在 map reduce 作业之间传递变量

标签 hadoop dictionary mapreduce jobs reduce

我无法理解如何将变量(输出)从 Job1 传递到 Job2。

假设我的 Job1 是 WordCount。 N=230 中的最终 reducer 输出。

我的第二份工作需要这些信息作为其逻辑。但我不希望它作为映射器输入。我希望输入与 Job1 相同。

我不喜欢使用 Counter,因为我读到它不是很可靠。

谢谢

最佳答案

您可以将 N 传递给第二个作业,将 N 添加到第二个作业配置对象。要将任何键/值添加到配置中,您可以使用提交作业的客户端的“设置”方法。然后,从映射器中,您可以使用“get”方法检索配置中 N 的值。查看“配置”文档,您会发现“获取”、“设置”和许多专门的方法,具体取决于您要添加的值的原始类型。

关于hadoop - 在 map reduce 作业之间传递变量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30546847/

相关文章:

SwiftUI 使用 ForEach 遍历字典

python - 一次对两个元素进行分组

hadoop - Mapreduce 作业 ipc.Client 重试连接

java - Amazon Web 服务 EMR 文件系统

hadoop - 是否可以在docker文件中间执行CMD?

hadoop - 实现定制的原始比较器

Python:递归地将字典附加到另一个字典

hadoop - 在 pig v0.15 中设置队列名称

java - 有没有办法限制 MapReduce 程序的节点数?