我想用hadoop控制Map和Reduce之间的中间结果。
我想指定在 map 后将这些结果复制到哪里。
我会选择将减少的数据。
总而言之,我希望 map 的结果在流程洗牌和排序之前能做什么
我想要。
如果您有解决方案,请告诉我。
谢谢
最佳答案
您可以在特定的映射器获得InputSplit之后处理数据。在map
函数中指定逻辑。
I would want to specify where copy these results after the Map
使用
Context
Java类和FileSystem
在FS上刷新结果(本地,hdfs,ftp等)
I would to choose data which will be reduced
i want map's results before process shuffle and sort and do what i want
在
map
类Mapper
函数上指定逻辑
关于hadoop - 控制中间体导致Hadoop,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24451732/