hadoop - 在Oozie Workflow中使用HBase表快照

标签 hadoop mapreduce hbase oozie hadoop2

我正在尝试在oozie上运行MapReduce作业,该作业将HBase表快照作为其输入。目前,我可以使用org.apache.hadoop.hbase.mapreduce.TableMapReduceUtil(不使用oozie工作流)来做到这一点,它为我提供了initTableSnapshotMapperJob()方法。

oozie中是否有类似的选项,我可以在其中指定HBase SNAPSHOT作为 map 缩小作业的输入。如果不是,还有哪些其他选择?

最佳答案

您可以为此使用Uber jar。 Oozie允许直接调度uber jar,而无需配置Mapper和Reducer:

<action name="mr-node">
    <map-reduce>
        <job-tracker>${jobTracker}</job-tracker>
        <name-node>${nameNode}</name-node>
        <configuration>
            <property>
                <name>oozie.mapreduce.uber.jar</name>
                <value>${nameNode}/user/${wf:user()}/my-uber-jar.jar</value>
            </property>
        </configuration>
    </map-reduce>
    <ok to="end"/>
    <error to="fail"/>
</action> 

在执行此操作之前,请确保在 oozie-site.xml ozt_rstrong中将 oozie.action.mapreduce.uber.jar.enable 属性设置为true。

关于hadoop - 在Oozie Workflow中使用HBase表快照,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28887223/

相关文章:

hadoop - Apache Hadoop pig SPLIT 不工作。给出错误 1200

hadoop - 我从哪里提交 hadoop 作业重要吗?

mysql - 使用Oracle Loader将HBase数据导入Oracle表

hadoop - Hadoop投机执行测试

java - HDFS 是否在请求的路径上创建所有目录?

sql - 像另一个一样创建一个配置单元表,但按键分区

java - 使用版本 0.98.0-hadoop2 写入 HBase 表

hadoop - 如何将航空扫描扫描作业更改为 map 缩减模式?

hadoop - 无法在hbase中创建表

hadoop - Hbase启动错误