我的MapReduce程序具有三个链接的MR作业。我想从主类访问MR1输出。在hadoop环境中可以吗?
如果没有,那么请提出是否还有其他方法可以做类似的事情。
最佳答案
一种方法是将作业1的输出提供给作业2的输入,将作业2的输出提供给作业3的输入。
这是一个示例:http://developer.yahoo.com/hadoop/tutorial/module4.html#chaining
该博客讨论了更多内容:
http://blogs.msdn.com/b/avkashchauhan/archive/2012/03/29/how-to-chain-multiple-mapreduce-jobs-in-hadoop.aspx
关于hadoop - 从Java主类访问MR作业输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17694904/