hadoop - 动态计算oozie参数(MR Action 的reducer数量)

标签 hadoop oozie

在我的 oozie 工作流程中，我动态创建了一个配置单元表，比如 T1。此配置单元操作之后是映射减少操作。我想将 reducers 属性 (mapred.reduce.tasks) 的数量设置为等于字段的不同值，比如 (T1.group)。关于如何动态设置某些 oozie 参数的值以及如何从 hive 不同操作获取参数值到 oozie 参数的任何想法？

最佳答案

希望对您有所帮助:

像您已经做的那样创建配置单元表。
执行另一个 Hive 查询，计算列的不同值并将其写入 hdfs 中的文件。
创建一个Shell 操作，它将读取文件并以key=value 的形式回显值。为 shell 操作启用 capture-output。
这是您的 MR 操作。现在使用 Oozie EL 函数访问操作数据。例如${wf:actionData('ShellAction')['key']}，将这个值传递给configuration中的mapred.reduce.tasks > MR Action 的标签。

关于hadoop - 动态计算oozie参数(MR Action 的reducer数量)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38325306/

上一篇：hadoop - 我们可以在 pig 中通过::分隔符拆分文件列吗

下一篇：csv - Pig CSVExcelStorage 双引号逗号

相关文章：

hadoop - Job 实例在 Hadoop 的构造函数中获取作业列表吗？

apache-spark - Oozie xmlns版本

hadoop - 在 Oozie 编辑器 (Hue) 中使用 Sqoop 操作时出错

java - 在mapreduce程序中未调用reducer

hadoop - 如何在hadoop集群上安装Kafka？

java - 将数据加载到Hbase

hadoop - Oozie SSH 操作

hadoop - 如何使用Oozie-coordinator.xml中的jceks文件路径设置set hadoop.security.credential.provider.path

shell - 需要使用 Hive 将变量从 Shell Action 传递给 Oozie Shell

java - ClassNotFound:apache.hadoop.io.ImmutableBytesWritable使用Python将Spark与Hbase集成