sungridengine - 确保 Star Cluster/SunGridEngine (AGE) 上的每个节点一个作业

标签 sungridengine qsub starcluster

qsub在 StarCluster/SGE 集群上处理作业,是否有一种简单的方法可以确保每个节点一次最多接收一个作业?我遇到了多个作业最终在同一节点上导致内存不足 (OOM) 问题的问题。

我尝试使用 -l cpu=8但我认为这不会检查使用的内核数,而只是检查盒子本身的内核数。

我也试过 -l slots=8但后来我得到:

Unable to run job: "job" denied: use parallel environments instead of requesting slots explicitly.

最佳答案

在您的配置文件 (.starcluster/config) 中添加以下部分:

[plugin sge]
setup_class = starcluster.plugins.sge.SGEPlugin
slots_per_host = 1

关于sungridengine - 确保 Star Cluster/SunGridEngine (AGE) 上的每个节点一个作业,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25672896/

相关文章:

sungridengine - Sun Grid Engine 完成的作业信息

linux - 如何在 qsub 命令中使用管道或重定向?

java - 如何使用qsub来实现java程序

google-compute-engine - 在 Google Compute Engine 上设置和运行网格作业的工具?

cluster-computing - "qsub -now"相当于使用 bsub

bash - 尽管有 shebang,qsub 仍在 csh 中执行我的 bash 脚本

Python:回显子进程

csh - 如何在 PBS 扭矩中使用 qsub -v 命令?

c - 在 EC2 上运行 C 模拟

amazon-web-services - StarCluster 的替代品?