我注意到,如果两个用户尝试同时运行 CUDA 程序,它往往会锁定卡或驱动程序(或两者?)。我们需要重置卡或重新启动机器才能恢复正常行为。
有没有办法锁定 GPU,以便其他程序在运行时无法干扰它?
编辑
操作系统是在服务器上运行的 Ubuntu 11.10。当没有运行 X Windows 时,该卡用于显示文本系统控制台。有多个用户。
最佳答案
如果您在使用 TCC 驱动程序的 Linux 或 Windows 上运行,则可以使用 nvidia-smi
utility 将 GPU 置于计算独占模式。 。
如果另一个进程已在该 GPU 上拥有上下文,计算独占模式会使驱动程序拒绝上下文建立请求。任何尝试在繁忙的计算专用 GPU 上运行的进程都会收到“无设备可用”错误并失败。
关于cuda - 如何防止两个CUDA程序互相干扰,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13900078/