hadoop - 用hadoop实现工厂流水线结构

标签 hadoop

<分区>

我想实现一个类似流水线的结构,在每个时间间隔内使用 hadoop 进行 Map-Reduce。关于我应该使用的架构/软件栈有什么建议吗?

最佳答案

看看Apache Oozie .我没有尝试过 Oozie,所以我不知道它的优缺点以及必须进行哪些定制才能满足指定的要求。

Oozie Coordinator jobs are recurrent Oozie Workflow jobs triggered by time (frequency) and data availabilty.

关于hadoop - 用hadoop实现工厂流水线结构,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9065682/

相关文章:

hadoop - 无法在 HDP 2.0 上运行 Spark 1.0 SparkPi

Hadoop - 当多个进程试图同时写入同一个文件时会发生什么?

hadoop - PIG无法读取导致工作失败的本地CSV

hadoop - 如何在hive-site.xml中映射Hive仓库路径?

hadoop - Hive - 连接中的 Case 语句 - 错误

hadoop - Oozie map-reduce 作业永远停留在 PREP 状态

java - 使用 Java API 查找提交 yarn 应用程序的用户

hadoop - PIG-Hadoop - 在 PIG 中有一种方法可以使用 Regex 进行内部连接

hadoop - Datanode之一磁盘卷故障

sql - Hive 查询在 group by 期间根据另一列选择一列