据我所知,Fermi GPU 支持预取 L1 或 L2 缓存。然而,在CUDA引用手册中我找不到任何相关内容。
由于 CUDA 允许我的内核代码将特定数据预取到特定级别的缓存?
最佳答案
这里不是指令级别,而是有关 GPU 预取的详细信息:
Many-Thread Aware Prefetching Mechanisms for GPGPU Applications
(2010年ACM微架构研讨会论文)
您可以在 nVIDIA 的 PTX ISA reference 中找到指令引用文档;相关说明为prefetch
and prefetchu
.
关于caching - 我可以将特定数据预取到 CUDA 内核中的特定缓存级别吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4755275/