memory - "gld/st_throughput"和 "dram_read/write_throughput"指标有什么区别？

标签 memory cuda metrics throughput

在 CUDA 可视化分析器版本 5 中，我知道“gld/st_requested_throughput”是应用程序请求的内存吞吐量。然而，当我试图找到硬件的实际吞吐量时，我很困惑，因为有两对似乎合格的指标，它们是“gld/st_throughput”和“dram_read/write_throughput”。哪一对实际上是硬件吞吐量？另一个是做什么的？

最佳答案

gld/st_throughput 包括由 L1 和 L2 缓存提供服务的事务。而dram_read/write_throughput是L2和设备内存之间的吞吐量。因此，每个全局内存访问都计入 gld/st_throughput，但只有错过 L1 和 L2 缓存的请求才计入 dram_read/write_throughput。

我还没有在任何地方找到关于柜台的详细概述。希望 NVIDIA 能够提供...

关于memory - "gld/st_throughput"和 "dram_read/write_throughput"指标有什么区别？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13840328/

上一篇：git - 在嵌入式系统上构建git

下一篇：regex - 正则表达式寻找多个值

相关文章：

python - 如何在不浪费内存的情况下重置树？

timer - 使用事件计时 CUDA 应用程序

c++ - 自动获取某段代码的浮点运算次数

iOS Swift 内存错误，在模拟器上不会发生？

Android 内存不足位图

c++ - 如何使用cmake将cuda文件正确链接到cpp文件

java - 计算LCOM3？

java - 如何让 IntelliJ 使用多个线程进行后台工作？

ios - ARC 和 Storyboard 的内存问题

linux - 在 Linux (Ubuntu) 中编译基本 C 语言 CUDA 代码