我是Hadoop的新手,目前正在设计MapReduce应用程序。在我的情况下,我有一个csv文件。我希望对csv文件中的每一行取平均,以便为每一行创建一个单独的映射器。据我了解,TextInputFormat将自动按行分割文件。那我是否理解,也将自动为每行创建一个单独的映射器?如果没有,该如何告诉Hadoop做我想做的事情?我必须实现自定义拆分器吗?谢谢!
最佳答案
没关系。我想到了。我需要使用NLineInputFormat。
关于hadoop - 了解TextInputFormat,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23284228/