SLURM 作业历史记录 : get full length JobName

标签 slurm

我想获取有关我的 SLURM 工作历史记录的信息。我使用类似的东西

sacct --starttime 2014-07-01 --format=User,JobID,Jobname,partition,state,time,start,end,elapsed,MaxRss,MaxVMSize,nnodes,ncpus,nodelist

获取我的工作摘要,但很难跟踪 JobName 部分只显示我工作名称的一小部分。我有很多工作的名字共享几个词。我会的 sacct命令显示更多的作业名称,优先显示全名。我注意到其他列宽是为适应下面的信息而制作的,那么为什么不使用 JobName 呢?

最佳答案

从 sacct 手册页:

   -o, --format
             Comma separated list of fields. (use "--helpformat" for a list of available fields).
             NOTE: When using the format option for listing various fields you can put a %NUMBER afterwards to specify how many characters should be printed.
             e.g. format=name%30 will print 30 characters of field name right justified.  A %-30 will print 30 characters left justified.
             When set, the SACCT_FORMAT environment variable will override the default format.  For example:
             SACCT_FORMAT="jobid,user,account,cluster"


所以你可以简单地指定 Jobname 的长度字段添加 %NUMBER之后。

它看起来像这样:
sacct --starttime 2014-07-01 --format=User,JobID,Jobname%50,partition,state,time,start,end,elapsed,MaxRss,MaxVMSize,nnodes,ncpus,nodelist

PS:尽量避免从数据库中查询过多的值,因为这可能需要很长时间并影响slurm的正确行为。所以把时间范围缩小到一个合理的值。

关于SLURM 作业历史记录 : get full length JobName,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48187625/

相关文章:

fortran - 在 slurm 中使用 srun 或 mpirun 时作业失败

r - Amazon AWS 上并行运行专为 Slurm 管理器设计的 R 代码的最佳选择是什么?

bash - 用于从不同但匹配的子目录提交多个 slurm 作业的脚本

slurm - 在 SLURM 中与 mpi 任务一起运行 "monitor"任务

centos - 重启状态为down的节点

python - 在 SLURM 中使用 sbatch 命令时如何导入本地 python 模块

python - 使用 slurm 在网格上运行 helloworld.py 程序

Tensorflow 停止训练并随机卡在 GPU 上

slurm - 如何使用 slurm 并行化这个 for 循环?

apache-spark - 获取用于调优的节点数、代码数和可用 RAM