我正在尝试编写一个(Python)函数来生成 PBS 作业提交脚本。用户应该能够请求作业的一些限制,例如每个节点的进程数、内存量和挂起时间。我找到了很多关于如何设置这些资源的示例,但我从未找到准确的描述。
例如,节点数(node
)和每个节点的进程数(ppn
)通常写在同一行,但我不知道是否这是强制性的。如果我在 2 条不同的(可能不连续的)线上设置这 2 个参数,它会起作用吗?这将大大简化实现。
mem
,也与节点配置有关,经常在另一行设置,这让我认为这是可能的。
在之前的实现中,我尝试将所有选项写在同一行上,但我注意到,例如,walltime 并未得到遵守。有谁知道这方面的详尽文档?如果没有,有谁知道我是否可以分离 nodes
和 ppn
。
最佳答案
以下是 TORQUE 软件(PBS 的一种实现)的描述:http://docs.adaptivecomputing.com/suite/8-0/basic/help.htm#topics/torque/2-jobs/requestingRes.htm
从文档中看来,nodes
资源必须在一行上指定,具体为
{<node_count> | <hostname>} [:ppn=<ppn>][:gpus=<gpu>] [:<property>[:<property>]...] [+ ...]
请记住,PBS ( https://en.wikipedia.org/wiki/Portable_Batch_System ) 是一个具有多个实现的通用系统,因此资源请求方式可能会有所不同。
关于python - PBS 职位限制指令的语法是什么,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27114214/