如果我的输入文件夹中有两个文件,hadoop mapreduce 会将这两个文件作为 .有没有办法为这两个文件指定不同的处理方式?例如,假设我 encounter 不是为每个单词触发 1 ,如果这个词在文件 1 中,我想触发一个 1,如果它出现在同一目录中的文件 2 中,我想触发一个 2。你会怎么做?
最佳答案
您应该能够获得此帖子中描述的文件名 How to get the input file name in the mapper in a Hadoop program?
一旦你有了文件名,你就可以有一个条件来检查文件名,你应该能够触发 1 或 2。
关于hadoop - Mapreduce 处理同一目录中的多个文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28843140/