我突然成为实验室集群的管理员,我迷失了方向。 我有管理 Linux 服务器的经验,但没有管理集群的经验。 集群似乎有很大不同。
我认为集群正在运行 CentOS 和 ROCKS。 我不确定 SGE 是什么以及它是否在集群中使用。
您能给我提供有关如何配置集群以及如何管理集群的概述或文档吗?我用谷歌搜索,但似乎有很多方法来构建集群,但从哪里开始令人困惑。
最佳答案
我也突然成为了 Rocks Clusters 管理员。虽然您的 CentOS 知识会很方便,但还是有一些“Rocks”的做事方式,您需要仔细阅读。它们大多从 CLI 命令 rock list|set 命令开始,当您学习它们时,它们非常好用。
您可能应该首先阅读文档(对于最新版本,您可以通过“rocks report version”找到您的文档): http://central6.rocksclusters.org/roll-documentation/base/6.1/
您可以在以下位置阅读 SGE 部分: http://central6.rocksclusters.org/roll-documentation/sge/6.1/
我建议您注册 Rokcs 集群讨论邮件列表: https://lists.sdsc.edu/mailman/listinfo/npaci-rocks-discussion
该列表非常友好。
关于centos - 管理 ROCKS 集群,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15931650/