hadoop - 资源管理器处理跨异构系统的大规模工作流

标签 hadoop mapreduce nagios

我正在寻找可以在分布式计算环境中管理大规模工作流的开源资源管理器。 我对 TORQUE、SLURM、LOADLEVELER 进行了调查,SLURM 在处理大型节点方面优于 TORQUE,但在单个集群中。全部用于批处理系统。 Condor 用于网格环境,但提供粗粒度的分布式并行化。 我觉得 Ganglia 和 Nagios 在高性能计算环境中表现不错。但我想知道 Ganglia 和 Nagios 是否可以用于 Workflows?可以将我的调度算法嵌入到调度程序中,并通过 Hadoop MapReduce 框架将其与资源管理器一起使用吗? 有帮助的回复更受欢迎。 谢谢。

最佳答案

Ganglia和Nagios是监控工具,不会给你资源管理。查看最新的 Hadoop。它在内部附带资源管理。

The new ResourceManager manages the global assignment of compute resources to applications and the per-application ApplicationMaster manages the application’s scheduling and coordination.

http://hadoop.apache.org/common/docs/r0.23.0/

关于hadoop - 资源管理器处理跨异构系统的大规模工作流,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8485138/

相关文章:

bash - AWK:这些声明是必需的吗?

hadoop - EMR集群如何连接JobTracker

Hadoop API : OutputFormat for Reducer

java - 具有 MultipleInputs 的 Hadoop 映射器的控制流程是什么?

linux - 如果我在其中放入退出代码,脚本将不起作用

oracle - 如何使用 nagios 从远程服务器中提取 Infomix 数据库信息?

java - 对于嵌入式数据库,数据库是否加载到 neo4j 的主内存中?

hadoop - 作业期间更改了Hadoop分布式缓存对象

java - 如何在java mapreduce hadoop中获得两个键的最大计数

dictionary - Clojure reducer /映射不工作