带有 CC 3.0 的 CUDA 的新 l1_shared_bank_conflict(或等效)计数器是什么?
在 CUPTI 用户指南中,它说 shared_[load|store]_bank_conflict,但是当我尝试这样做时它没有显示。
我在 Linux 中使用命令行分析器。
最佳答案
旧的命令行分析器不支持某些新计数器。如果您使用的是 CUDA 5,您可以尝试 nvprof:
nvprof --events l1_shared_bank_conflict <app_name>
nvprof --query-events
见 http://docs.nvidia.com/cuda/profiler-users-guide/index.html#nvprof-overview
关于cuda - l1 用于 CUDA CC 3.0 的共享银行冲突分析器计数器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13909271/