有没有办法要求 GPU(或驱动程序)列出 GPU 上事件(或分派(dispatch)或发布)的 CUDA 内核集,而不将 cuda-gdb
附加到所属的 CPU 进程并暂停它?
我正在想象类似 pstack 的东西,界面可能如下所示:
> list-cuda-kernels $pid
gpu 0: kernel_foo
gpu 0: kernel_bar
gpu 1: kernel_baz
最佳答案
除了 cuda-gdb(或任何其他 CUDA 调试器)之外,没有任何工具或 API 可以获取当前运行的内核列表。
关于debugging - 查询 GPU 上事件的 CUDA 内核集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12514683/