multithreading - CUDA computeprof无法与多线程一起使用

标签 multithreading qt cuda profiler

我正在尝试使用CUDA Computeprof(CUDA分析器)来分析多线程应用程序。

我已经用Qt实现了两个线程,每个线程都使用不同的CUDA上下文。我正在使用CUDA驱动程序API。探查器应用程序仅检测来自第一个(主)线程的CUDA调用,而完全忽略来自另一个线程的调用。

有人对此有解决方法或原因吗?

最佳答案

我通常使用Nvidia Parallel Nsight来分析多线程应用程序。但是我在MonteCarloMultiGPU SDK 3.2示例上测试了CUDA分析器,它确实为同一 session 分析了所有CUDA上下文。我正在使用CUDA 4.0随附的CUDA分析器。

关于multithreading - CUDA computeprof无法与多线程一起使用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9028988/

相关文章:

c - 多线程 C 应用程序中的访问冲突

c++ - 如何在 Qt 中的 QTextEdit 中显示文本后面或前景的图形对象?

qt - 客户端套接字发送但静默服务器套接字不接收

qt 配置交叉编译问题 : device and xplatform

cuda - 优化非常简单的图像处理内核

cuda - GPU/CUDA 核心是 SIMD 核心吗?

java - invokeAll() vs Guava ListenableFuture+addCallback()

Python 线程 : Multiple While True loops

c - 如何以有效的方式并行化这个三重循环?

java - 我如何检查动态线程是否结束