cuda - l1 用于 CUDA CC 3.0 的共享银行冲突分析器计数器

标签 cuda gpu profiler

带有 CC 3.0 的 CUDA 的新 l1_shared_bank_conflict(或等效)计数器是什么?
在 CUPTI 用户指南中,它说 shared_[load|store]_bank_conflict,但是当我尝试这样做时它没有显示。

我在 Linux 中使用命令行分析器。

最佳答案

旧的命令行分析器不支持某些新计数器。如果您使用的是 CUDA 5,您可以尝试 nvprof:

nvprof --events l1_shared_bank_conflict <app_name>

nvprof --query-events

http://docs.nvidia.com/cuda/profiler-users-guide/index.html#nvprof-overview

关于cuda - l1 用于 CUDA CC 3.0 的共享银行冲突分析器计数器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13909271/

相关文章:

c++ - 如何分析内存使用情况?

c++ - 用于矩形矩阵转置的就地 CUDA 内核

c++ - CUDA Vector Reduction 处理长度小于 512 的 vector ?

opencl - 如何使自定义指标中的 OnCalculate() 函数在 MQL5/OpenCL 中使用 GPU?

python - 带有 moviepy 的 FFMPEG

c# - Entity Framework 探查器 - ASP.NET MVC4 与 EF 6 - 无法确定提供者名称

cuda - 无法创建推力设备向量

c++ - CUDA 中的 3D 元素矩阵乘法?

image - cuda 中的 Sobel 过滤器(无法显示完整图像)

docker - 如何将探查器附加到 docker 进程