hadoop - 动态计算oozie参数(MR Action 的reducer数量)

标签 hadoop oozie

在我的 oozie 工作流程中,我动态创建了一个配置单元表,比如 T1。此配置单元操作之后是映射减少操作。我想将 reducers 属性 (mapred.reduce.tasks) 的数量设置为等于字段的不同值,比如 (T1.group)。关于如何动态设置某些 oozie 参数的值以及如何从 hive 不同操作获取参数值到 oozie 参数的任何想法?

最佳答案

希望对您有所帮助:

  1. 像您已经做的那样创建配置单元表。
  2. 执行另一个 Hive 查询,计算列的不同值并将其写入 hdfs 中的文件。
  3. 创建一个Shell 操作,它将读取文件并以key=value 的形式回显值。为 shell 操作启用 capture-output
  4. 这是您的 MR 操作。现在使用 Oozie EL 函数访问操作数据。例如${wf:actionData('ShellAction')['key']},将这个值传递给configuration中的mapred.reduce.tasks > MR Action 的标签。

关于hadoop - 动态计算oozie参数(MR Action 的reducer数量),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38325306/

相关文章:

hadoop - Job 实例在 Hadoop 的构造函数中获取作业列表吗?

apache-spark - Oozie xmlns版本

hadoop - 在 Oozie 编辑器 (Hue) 中使用 Sqoop 操作时出错

java - 在mapreduce程序中未调用reducer

hadoop - 如何在hadoop集群上安装Kafka?

java - 将数据加载到Hbase

hadoop - Oozie SSH 操作

hadoop - 如何使用Oozie-coordinator.xml中的jceks文件路径设置set hadoop.security.credential.provider.path

shell - 需要使用 Hive 将变量从 Shell Action 传递给 Oozie Shell

java - ClassNotFound:apache.hadoop.io.ImmutableBytesWritable使用Python将Spark与Hbase集成