caching - 我可以将特定数据预取到 CUDA 内核中的特定缓存级别吗？

标签 caching cuda gpgpu prefetch ptx

据我所知，Fermi GPU 支持预取 L1 或 L2 缓存。然而，在CUDA引用手册中我找不到任何相关内容。

由于 CUDA 允许我的内核代码将特定数据预取到特定级别的缓存？

最佳答案

这里不是指令级别，而是有关 GPU 预取的详细信息:

Many-Thread Aware Prefetching Mechanisms for GPGPU Applications
(2010年ACM微架构研讨会论文)

您可以在 nVIDIA 的 PTX ISA reference 中找到指令引用文档;相关说明为prefetch and prefetchu .

关于caching - 我可以将特定数据预取到 CUDA 内核中的特定缓存级别吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/4755275/

上一篇：gruntjs - 如何从 grunt-contrib-imagemin 中排除目录

下一篇：Netbeans 7 和 Jetty

相关文章：

javascript - Service Worker 缓存未将所有文件存储在数组中

windows - 如何以编程方式杀死 CUDA 内核

cuda - 常见的编程任务在 GPU 上的转化效果如何？

angular - 如何使用 Gulp-Rev 和 Gulp-Rev-Collector 正确解决浏览器缓存问题，以便更新我的 index.html 文件

spring - Ehcache 元素在缓存中的生存期

java - 如何以编程方式调用 infinispan 缓存加载器

linux - nvidia cuda 和驱动程序版本不足

c++ - 如何在cuda中生成伪随机数

c - CUDA FFT 函数调用期间出现错误“code=2(CUFFT_ALLOC_FAILED)”

cuda - 如果我们有 GPGPU，为什么要使用 SIMD？

©2024 IT工具网联系我们