java - 如何从 Map-Reduce 中的多个目录读取多个文件

标签 java hadoop

我想在 Map-Reduce 程序中从多个目录读取多个文件。 我试图在 main 方法中给出文件名:

FileInputFormat.setInputPaths(conf,new Path("hdfs://localhost:54310/user/test/"));
FileInputFormat.setInputPaths(conf,new Path("hdfs://localhost:54310/Test/test1/"));

但它只读取一个文件。

读取多个文件应该怎么办?

请提出解决方案。

谢谢。

最佳答案

FileInputFormat#setInputPaths 将在覆盖之前设置的输入路径后设置输入路径。使用 FileInputFormat#addInputPathFileInputFormat#addInputPaths添加到现有路径。

关于java - 如何从 Map-Reduce 中的多个目录读取多个文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8656618/

相关文章:

java - 接收可序列化对象并显示内容

java - 套接字绑定(bind)错误

hadoop - 用于 Teradata 的 HDFS

java - 仅使用集合中的数字找到等于或大于给定目标的总和

java - 无法追加

java - 用 ASM 结果修改方法体 "Exceeded max stack size during"

java - 运行HIVE命令引发错误:线程 “main”中的异常java.lang.RuntimeException:org.apache.hadoop.hive.ql.metadata.HiveException

java - Mapreduce作业在群集上提供空输出

hadoop - 配置单元加载数据 :how to specify file column separator and dynamic partition columns?

hadoop - Apache Ambari HDP 2.5上的Hive安装问题