memory - "gld/st_throughput"和 "dram_read/write_throughput"指标有什么区别?

标签 memory cuda metrics throughput

在 CUDA 可视化分析器版本 5 中,我知道“gld/st_requested_throughput”是应用程序请求的内存吞吐量。然而,当我试图找到硬件的实际吞吐量时,我很困惑,因为有两对似乎合格的指标,它们是“gld/st_throughput”和“dram_read/write_throughput”。哪一对实际上是硬件吞吐量?另一个是做什么的?

最佳答案

gld/st_throughput 包括由 L1 和 L2 缓存提供服务的事务。而dram_read/write_throughput是L2和设备内存之间的吞吐量。因此,每个全局内存访问都计入 gld/st_throughput,但只有错过 L1 和 L2 缓存的请求才计入 dram_read/write_throughput

我还没有在任何地方找到关于柜台的详细概述。希望 NVIDIA 能够提供...

关于memory - "gld/st_throughput"和 "dram_read/write_throughput"指标有什么区别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13840328/

相关文章:

python - 如何在不浪费内存的情况下重置树?

timer - 使用事件计时 CUDA 应用程序

c++ - 自动获取某段代码的浮点运算次数

iOS Swift 内存错误,在模拟器上不会发生?

Android 内存不足位图

c++ - 如何使用cmake将cuda文件正确链接到cpp文件

java - 计算LCOM3?

java - 如何让 IntelliJ 使用多个线程进行后台工作?

ios - ARC 和 Storyboard 的内存问题

linux - 在 Linux (Ubuntu) 中编译基本 C 语言 CUDA 代码