hadoop - MapReduce中多个输入路径中的错误

标签 hadoop mapreduce

我在Eclipse中编写一个Multiple Input Mapreduce程序,下面是代码行的一部分

码:

Path map1=new Path(args[0]);
Path map2=new Path(args[1]);

MultipleInputs.**addInputPath**(job,map1, TextInputFormat.class,Mapper1.class);
MultipleInputs.**addInputPath**(job,map2, TextInputFormat.class,Mapper2.class);

在“addInputpath”中,出现以下错误,

错误:MultipleInputs类型的方法addInputPath(Job,Path,Class,Class)不适用于参数(Job,Path,Class,Class)

有人可以帮忙吗?

请在下面的链接中找到代码

https://www.dropbox.com/s/fm3m0ed4gh6jy98/Code

问候,
Vishwa

最佳答案

我能告诉你的是,您错误地导入了不兼容的,

import org.apache.hadoop.mapred.TextInputFormat;

应该是
import org.apache.hadoop.mapreduce.lib.input.TextInputFormat;

Hadoop提供了两种API来创建作业,一个属于org.apache.hadoop.mapred,另一个属于org.apache.hadoop.mapreduce。我认为您正在使用后者,那就是您应该导入的那个。

关于hadoop - MapReduce中多个输入路径中的错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17825196/

相关文章:

amazon-web-services - 配置单元查询抛出错误输入字符串: “__HIVE_D”不是整数

hadoop - 从Beeline连接时,Hive查询在Tez上失败,但在Map-Reduce上成功

java - 在安装方法中,有什么方法可以获取与当前文件(在hdfs中)相同文件夹中的文件列表?

hadoop - 在 pig 中分组时如何处理倾斜数据

java - NiFi - 自定义 orc 处理器为类 org.apache.hadoop.hdfs.DistributedFileSystem 提供 NoClassDefFoundError

hadoop - Yarn NodeManager 和 ResourceManager 在同一节点

hadoop - IIS日志实时流式传输到Hadoop

generics - 引用具有原始类型约束的基本类型

mapreduce - pymongo mapreduce 数据库断言失败

hadoop - mapreduce 作业的 StreamInputFormat