我正在尝试使用CUDA Computeprof(CUDA分析器)来分析多线程应用程序。
我已经用Qt实现了两个线程,每个线程都使用不同的CUDA上下文。我正在使用CUDA驱动程序API。探查器应用程序仅检测来自第一个(主)线程的CUDA调用,而完全忽略来自另一个线程的调用。
有人对此有解决方法或原因吗?
最佳答案
我通常使用Nvidia Parallel Nsight来分析多线程应用程序。但是我在MonteCarloMultiGPU SDK 3.2示例上测试了CUDA分析器,它确实为同一 session 分析了所有CUDA上下文。我正在使用CUDA 4.0随附的CUDA分析器。
关于multithreading - CUDA computeprof无法与多线程一起使用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9028988/