我正在 Java 中动态生成一些 Pig 查询,并使用 PigServer 类执行相同的查询。有什么方法可以异步提交作业并稍后轮询/ Hook 以完成作业?另外,如果 Pig 不允许,我可以使用 Oozie 和 Java Action 来实现所需的行为吗?
最佳答案
您可以使用fork and join control nodes在 OOZIE 中并行运行作业。
如果您只想更改要运行的 Pig 脚本的某些属性,则执行动态代码很容易(您可以使用模板变量 - 请参阅 oozie pig action 文档)。但是,如果动态意味着动态构建不同的代码路径,那么您需要一个自定义 Java 操作,在调用 Pig 操作之前将 Pig 脚本写入 HDFS。
关于java - 异步 pig 作业提交,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14136006/