java - 异步 pig 作业提交

标签 java hadoop apache-pig oozie

我正在 Java 中动态生成一些 Pig 查询,并使用 PigServer 类执行相同的查询。有什么方法可以异步提交作业并稍后轮询/ Hook 以完成作业?另外,如果 Pig 不允许,我可以使用 Oozie 和 Java Action 来实现所需的行为吗?

最佳答案

您可以使用fork and join control nodes在 OOZIE 中并行运行作业。

如果您只想更改要运行的 Pig 脚本的某些属性,则执行动态代码很容易(您可以使用模板变量 - 请参阅 oozie pig action 文档)。但是,如果动态意味着动态构建不同的代码路径,那么您需要一个自定义 Java 操作,在调用 Pig 操作之前将 Pig 脚本写入 HDFS。

关于java - 异步 pig 作业提交,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14136006/

相关文章:

java - 尝试运行多类项目时 Android Studio 模拟器崩溃

hadoop - hadoop 版本之间有什么区别?

r - Sparklyr copy_to 失败

hadoop - 在hive中的所有数据库中搜索一个表

java - 如何在单独的Java程序中读取pig输出

hadoop - Apache pig : Convert bag of tupple to single tupple

java - 如何在用户关闭应用程序 JFrame 之后、程序退出之前直接保存一些对象?

java - 通过不同的端口将数据返回给客户端

java - 使用 RestTemplate 解析本地 JSON 文件

java - pig 栏连字符(-)