CUDA : How to detect shared memory bank conflict on device with compute capabiliy >= 7. 2?

标签 cuda profiling gpu-shared-memory nsight-compute

在计算能力 <= 7.2 的设备上,我总是使用

nvprof --events shared_st_bank_conflict

但是当我使用 CUDA10 在 RTX2080ti 上运行它时,它返回

警告:跳过设备 0 上的分析,因为计算能力大于 7.2 的设备不支持分析

那么如何检测此设备上是否存在共享内存库冲突?

我已经安装了 Nvidia Nsight Systems 和 Nsight Compute,没有找到这样的分析报告...

感谢

最佳答案

这似乎是一个问题,并在 this 中得到解决。发布到 NVIDIA 论坛。显然,使用其中一种 Nsight 工具(CLI 或 UI)应该支持它。

关于CUDA : How to detect shared memory bank conflict on device with compute capabiliy >= 7. 2?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55297281/

相关文章:

ubuntu - 在 CUDA 6.5 中使用 nvvp 分析 PyCUDA 代码

c - 启动内核时共享内存和流

cuda - 与 CUDA 共享内存互斥体 - 添加到项目列表

cuda - Fermi 及更高版本中共享内存库冲突的相关性

cuda - 我可以将 CUDA 与非 NVIDIA GPU 一起使用吗?

c# - 运行时代码覆盖工具

haskell - 优化 Haskell GC 使用

python - 如何运行 CUDA 8.0 中包含的示例文件?

linux - cuda-gdb 在 linux 上的 nsight 中不工作

c++ - CUDA 结合 OpenMP