hadoop - OOZIE 中的多输入路径配置

标签 hadoop oozie

我正在尝试在 oozie 中配置 Mapreduce 作业。此作业有两种不同的输入格式和两个输入数据文件夹。我用了这个帖子How to configure oozie workflow for multi-input path with multiple mappers 并将这些属性添加到我的 workflow.xml 中:

        <property>
                <name>mapred.input.dir.formats</name>
                <value>folder/data/*;org.apache.hadoop.mapred.SequenceFileInputFormat\,data/*;org.apache.hadoop.mapred.TextInputFormat</value>
            </property>

            <property>
                <name>mapred.input.dir.mappers</name>
                <value>folder/data/*;....PublicMapper\,data/*;....PublicMapper</value>
            </property>

但是当作业启动时出现以下错误:“作业中未指定输入路径”。

有没有人可以帮助我?

感谢

最佳答案

您需要设置一些额外的属性:

<property>
  <name>mapreduce.inputformat.class</name>
  <value>org.apache.hadoop.mapreduce.lib.input.DelegatingInputFormat</value>
</property>
<property>
  <name>mapreduce.map.class</name>
  <value>org.apache.hadoop.mapreduce.lib.input.DelegatingMapper</value>
</property>

关于hadoop - OOZIE 中的多输入路径配置,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20194472/

相关文章:

shell - Oozie 电子邮件操作附件

hadoop - 将中间 Amazon EMR 任务输出写入 S3

hive - 使用 ">"通过 oozie 保存 hive 输出

hadoop - 配置单元按日期分区—一次处理多个日期?

hadoop - HBase截断表

hadoop - oozie中的<FS>中的多个move语句

hadoop - oozie hive action 创建的表在 hive client 中找不到,但在 HDFS 中可以找到

hadoop - 具有 Hive 操作的 Oozie 工作流因权限问题而失败

bash - 如何存储/*url* 的实际名称?

hadoop - HDFS 错误放置 : `input' : No such file or directory