hadoop - 控制中间体导致Hadoop

我想用hadoop控制Map和Reduce之间的中间结果。
我想指定在 map 后将这些结果复制到哪里。
我会选择将减少的数据。
总而言之，我希望 map 的结果在流程洗牌和排序之前能做什么
我想要。
如果您有解决方案，请告诉我。

谢谢

最佳答案

您可以在特定的映射器获得InputSplit之后处理数据。在map函数中指定逻辑。

I would want to specify where copy these results after the Map

使用Context Java类和FileSystem在FS上刷新结果
(本地，hdfs，ftp等)

I would to choose data which will be reduced

i want map's results before process shuffle and sort and do what i want

在map类

中的Mapper函数上指定逻辑

关于hadoop - 控制中间体导致Hadoop，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24451732/

相关文章：

php - 具有实时余额更新的大批量交易的最佳实践