cuda - 如何确定内核是否受内存限制或计算限制?

标签 cuda

我认为我的内核受内存限制(因为大多数 GPGPU 代码受内存限制),但我实际上并不确定。我怎样才能自己找到它。可能必须使用视觉分析器,因为它取决于所使用的 GPU。

如果 CUDA 编程指南或其他 NVIDIA 文档中对此进行了解释,请随时发布带有页码的链接,以便我可以自己阅读。

澄清

我更喜欢如何确定限制因素的一般“规则”,但在我的特殊情况下,您可以在这里找到有关我的内核的详细信息:Using `overlap`, `kernel time` and `utilization` to optimize one's kernels

最佳答案

这个presentation来自 NVIDIA 的演讲讲述了通过修改源代码有选择地禁用内核中的内存访问和算术,以确定其中之一是否限制了您的性能。

关于cuda - 如何确定内核是否受内存限制或计算限制?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7839474/

相关文章:

cuda - cufftGetSize1d 中的 CUFFT_INVALID_VALUE

python - PyCuda 中 3D 数组的就地转置

linux - Cuda GPUDirect 到网卡/硬盘?

opengl - OpenGL CUDA互操作的内部格式

java - JCuda : doing parallel arithmetic operations on arrays?

c++ - CUDA:统一内存,使用数组

Cuda 2d 或 3d 数组

cuda - GPU Kepler CC3.0 处理器不仅是流水线架构,还是超标量?

c++ - CUDA - 没有 block ,只有未定义维度的线程

python - Numba 矩阵向量乘法