我正在用Java写一个基本的hadoop字数统计函数,需要将输出格式化为(k:v)而不是默认的(k'\ t'v)格式。到目前为止,我仅找到了使用KeyValueTextInputFormat格式化输入定界符的方法(已弃用),并且似乎没有对应的版本用于输出格式。有没有简单的方法可以做到这一点?
最佳答案
可以通过将作业的mapred.textoutputformat.separator
中的此参数configuration
设置为所需的定界符来实现。在您的情况下,它将类似于conf.set("mapred.textoutputformat.separator", ":");
。根据hadoop和发行版的版本,参数名称可能不同。
关于java - 更改MapReduce(K,V)输出格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22467704/