在计算能力 <= 7.2 的设备上,我总是使用
nvprof --events shared_st_bank_conflict
但是当我使用 CUDA10 在 RTX2080ti 上运行它时,它返回
警告:跳过设备 0 上的分析,因为计算能力大于 7.2 的设备不支持分析
那么如何检测此设备上是否存在共享内存库冲突?
我已经安装了 Nvidia Nsight Systems 和 Nsight Compute,没有找到这样的分析报告...
感谢
最佳答案
这似乎是一个问题,并在 this 中得到解决。发布到 NVIDIA 论坛。显然,使用其中一种 Nsight 工具(CLI 或 UI)应该支持它。
关于CUDA : How to detect shared memory bank conflict on device with compute capabiliy >= 7. 2?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55297281/