hadoop - 如何使用 MultipleTextOutputFormat 类将默认输出文件重命名为一些有意义的名称？

在 Hadoop 的 reduce 阶段之后，我希望输出文件名根据输入键值有意义。但是，我没有成功遵循“Hadoop:权威指南”上的示例，该示例使用 MultipleTextOutputFormat 来执行此操作。原因是它基于旧 API 而不适用于新 API？

任何人都可以提示解决方案或向我指出相关文档吗？

最佳答案

你可能是对的。大多数在旧 API 中有效的功能在新 API 中并不总是有效。

现在有一种“新方法”可以做到这一点，称为 MultipleOutputs .

关于hadoop - 如何使用 MultipleTextOutputFormat 类将默认输出文件重命名为一些有意义的名称？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/7464789/

相关文章：

ubuntu - 复制本地数据到hadoop hdfs报错