cluster-computing - 多用户集群: IBM Platform LSF: user changing priority of jobs

标签 cluster-computing priority-queue hpc lsf

我是使用 IBM Platform LSF(在 Linux 上)的多用户集群的用户。我想更改我的作业相对于我的相同作业的优先级(不是队列中作业的绝对优先级)。

举个例子:我已经在队列中启动了 500 个作业,需要 4 天才能完成,稍后我想提交另一个我想在我已经提交的 500 个作业之前运行的作业。

最佳答案

我在这里可以想到的几种方法:

  1. 当您使用-sp提交作业时,使用用户为您的作业分配的优先级(bsub选项)。 ,数字越大表示越重要。一些注意事项:

    • 只有当您的管理员定义了 MAX_USER_PRIORITY 时,此功能才有效。在配置中(我一辈子都不记得这是否是开箱即用的)。要检查它是否已启用,请运行 bparams -a | grep MAX_USER_PRIORITY ,如果它返回一些东西,你就可以开始了。
    • 默认情况下,作业的优先级为 $MAX_USER_PRIORITY / 2 ,所以如果 MAX_USER_PRIORITY = 100并且您已经提交了 500 个职位,但没有 -sp如果您想提交一项插队作业,请使用 bsub -sp优先级大于 50。
  2. 另一种方法是使用 btop通常开箱即用。基本上你正常提交你的工作,然后使用 btop <jobid>将特定工作移至相对于其他工作的最前面。

给您的一些链接:

关于cluster-computing - 多用户集群: IBM Platform LSF: user changing priority of jobs,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47697691/

相关文章:

用于集群和 HPC 的 C++ 编程

c++ - MPI中的MPI_Type_struct和MPI_Type_create_struct有什么区别?

linux - yum install 无法在没有 root 权限的集群上运行

r - 使用 Snowfall R 初始化 MPI 集群

python - 在自定义函数上加入两个 RDD - SPARK

c++ - 当你从 boost::fibonacci_heap 中删除一个元素时会发生什么?

c++ - 如果priority_queue的容器没有push_back函数怎么办

priority-queue - Java优先级队列: How to ensure that new nodes are inserted first if natural order (compareTo) is the same?

c# - Windows Azure HPC 调度程序

r - 如何将颜色更改为 fviz_silhouette 中簇号以外的变量