caching - 我可以将特定数据预取到 CUDA 内核中的特定缓存级别吗?

标签 caching cuda gpgpu prefetch ptx

据我所知,Fermi GPU 支持预取 L1 或 L2 缓存。然而,在CUDA引用手册中我找不到任何相关内容。

由于 CUDA 允许我的内核代码将特定数据预取到特定级别的缓存?

最佳答案

这里不是指令级别,而是有关 GPU 预取的详细信息:

Many-Thread Aware Prefetching Mechanisms for GPGPU Applications
(2010年ACM微架构研讨会论文)

您可以在 nVIDIA 的 PTX ISA reference 中找到指令引用文档;相关说明为prefetch and prefetchu .

关于caching - 我可以将特定数据预取到 CUDA 内核中的特定缓存级别吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4755275/

相关文章:

javascript - Service Worker 缓存未将所有文件存储在数组中

windows - 如何以编程方式杀死 CUDA 内核

cuda - 常见的编程任务在 GPU 上的转化效果如何?

angular - 如何使用 Gulp-Rev 和 Gulp-Rev-Collector 正确解决浏览器缓存问题,以便更新我的 index.html 文件

spring - Ehcache 元素在缓存中的生存期

java - 如何以编程方式调用 infinispan 缓存加载器

linux - nvidia cuda 和驱动程序版本不足

c++ - 如何在cuda中生成伪随机数

c - CUDA FFT 函数调用期间出现错误“code=2(CUFFT_ALLOC_FAILED)”

cuda - 如果我们有 GPGPU,为什么要使用 SIMD?