我有一堆作业在 slurm 中作为数组作业运行:
123_[1-500] PD my_job 0:00 me
123_2 R my_job 9:99 me
123_3 R my_job 9:99 me
123_4 R my_job 9:99 me
123_5 R my_job 9:99 me
...
当我阅读 scancel 上的手册页时,似乎表明如果我执行
scancel 123
它将停止一切我错了,还是有另一种方法可以停止阵列工作?我希望已经在运行的作业完成,我只是不想让
123
创建更多的作业,而且我真的不想弄清楚如果我不小心中途杀死了哪些作业需要重新运行
最佳答案
您可以发出 scancel
附加 --state
标签:
scancel --state=PENDING 123
或者,简而言之:
scancel -t PD 123
这只会取消 123 阵列中挂起的作业,而将运行已启动的作业。
关于slurm - 我可以取消 slurm 中的阵列作业吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47318252/