hadoop - 在减少阶段之后实现称为合并的第三阶段

标签 hadoop new-operator reduce phase

我需要添加第三阶段-合并-合并单独的并行Reduce任务的输出。这使得可以执行联接和构建笛卡尔积之类的事情。有人可以帮助我该怎么做吗? Hadoop 0.21 API支持他的功能。

最佳答案

Hadoop是一个MapReduce(不是MapReduceMerge!)框架,而且这种情况不太可能改变。也就是说,您可以提出Jira或向http://getsatisfaction.com/cloudera/提出要求,以正式表示立场。

如果需要加入,则应尝试Pig(我仅有的一个亲身经历过的人,但也有其他人-Hive,...)。 Pig使联接变得非常简单。

关于hadoop - 在减少阶段之后实现称为合并的第三阶段,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6253449/

相关文章:

shell - 使用 shell 脚本在目标中创建与源中相同的目录结构

c++ - System V IPC & 新

Raspberry Pi 的 Python 脚本无法正常运行

JavaScript reduce 在对象数组上返回对象

hadoop - 如何解决 talend open studio for Big data 中的 tHDFS 组件问题

hadoop - Apache PIG - 按 ID 计数(*)分组并创建排名

java.lang.ArrayIndexOutOfBoundsException : 2 error in mapreduce, Hadoop

javascript - 如何使用原型(prototype)创建类而不使用 "new"和 "this"

haskell - 使用折叠组合 monad Action

javascript - 计算可以为 null 或 undefined 的数组元素的总和