<分区>
我想实现一个类似流水线的结构,在每个时间间隔内使用 hadoop 进行 Map-Reduce。关于我应该使用的架构/软件栈有什么建议吗?
标签 hadoop
<分区>
我想实现一个类似流水线的结构,在每个时间间隔内使用 hadoop 进行 Map-Reduce。关于我应该使用的架构/软件栈有什么建议吗?
最佳答案
看看Apache Oozie .我没有尝试过 Oozie,所以我不知道它的优缺点以及必须进行哪些定制才能满足指定的要求。
Oozie Coordinator jobs are recurrent Oozie Workflow jobs triggered by time (frequency) and data availabilty.
关于hadoop - 用hadoop实现工厂流水线结构,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9065682/