我有四个节点,它们被设计为“ worker ”计算节点。由于我缺少另一台机器来充当“头”节点,我正在考虑使用其中一个节点作为“ Controller ”,但也可以同时成为“ worker ”。这种设置可以吗?我怎样才能做到这一点?如果是这样,是否建议这样做?
最佳答案
Is this setup possible?
只需将节点添加到分区。
例如,如果我的前端是:
ControlMachine=frontend
我会在我的节点列表中配置它:
NodeName=frontend CoresPerSocket=6 Sockets=2 ThreadsPerCore=1 ...
NodeName=node00 CoresPerSocket=6 Sockets=2 ThreadsPerCore=1 ...
NodeName=node01 CoresPerSocket=6 Sockets=2 ThreadsPerCore=1 ...
NodeName=node02 CoresPerSocket=6 Sockets=2 ThreadsPerCore=1 ...
最后我会将它们添加到分区中:
PartitionName=main Nodes=frontend,node00,node01,node02
And if so, is it advisable to do so?
我猜它不是生产集群,所以不会有问题。当然,该节点会加载更多,但您不太可能注意到它。
关于ubuntu - SLURM Controller 和 "Worker"是否可能在同一个节点中?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49551493/