hadoop - 如何在MapReduce中为输出赋予列名?

标签 hadoop mapreduce mapper

如何给MR中的输出赋予列名?
假设我有一个简单的文本,我想使用一个简单的字数统计程序来计数
但我想用列名获取输出信息吗?

最佳答案

您可以通过重写reducer的设置方法来实现。您可以将自定义 header 添加到setup方法中,然后执行map reduce输出。

关注MR API文档:http://hadoop.apache.org/docs/stable/api/org/apache/hadoop/mapreduce/Reducer.html

关于hadoop - 如何在MapReduce中为输出赋予列名?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27128316/

相关文章:

java - 级联的wordcount Java任务抛出nullPointErexception

python - 映射器功能,用于查找文本文件中的最小单词

hadoop - 需要在Pig脚本中按1分钟过滤记录

c# - Glue vs Automapper vs Emit vs ValueInjecter 实体映射器

java - 全局配置ObjectMapper(通过@Bean或smth)从 "data"节点解析

Hadoop Map-Reduce ,需要将两个mapper与一个普通的Reducer结合起来

hadoop - 是否可以将Solr或ElasticSearch配置为也支持MapReduce的方式将HDFS用作其持久层?

mysql - 如何在 UBUNTU 中从 Hive 到 HiveServer2

hadoop - 将数据从临时表移至登台表时,获取GC开销限制超出错误

android - Android 上兼容的对象到对象映射器