sql - 执行一堆配置单元查询(构建 DAG)

标签 sql hadoop hive workflow

背景

我希望执行一堆配置单元查询(大约 20-30 个查询,并且数量还在增加)。其中一些查询依赖于少数其他查询的结果,而其中一些可以并行执行。 (DAG)

问题

是否有一个工作流管理器可以负责构建 DAG(给定一堆查询作为输入)并并行/顺序执行这些查询(以最优化的方式)。

相同的最佳实践是什么。

最佳答案

您可以使用任何工具进行工作流管理。最佳实践取决于用例和专业知识。

传统上在企业中:- 可以使用 Control-M 或 cron 调度程序。

来自大数据生态系统:oozie 或 azkaban

还有其他几种工具可用于工作流管理。

关于sql - 执行一堆配置单元查询(构建 DAG),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42357911/

相关文章:

java - JPQL 选择具有实体 ID 的范围起始索引

php - mysql 如何根据另一个表的结果从一个表中获取内容

maven - 为什么在 Hadoop 3.1.0 中删除了 DFSInotifyEventInputStream?

hadoop - Hcatalog大于字段限制的文件

hadoop - 带有分区的外部配置单元表-当我添加具有读取访问权限的数据的分区时,权限错误

mysql - 如何导入dbf文件数据到phpMyAdmin(Mysql服务器)

MySQL 约束检查

hadoop - 在 map 函数中更新计数器并在 reduce 中访问

linux - 乌兹 : Sqoop dynamic target directory

Java : Interface in a class is not accessible while importing