在 CUDA 可视化分析器版本 5 中,我知道“gld/st_requested_throughput”是应用程序请求的内存吞吐量。然而,当我试图找到硬件的实际吞吐量时,我很困惑,因为有两对似乎合格的指标,它们是“gld/st_throughput”和“dram_read/write_throughput”。哪一对实际上是硬件吞吐量?另一个是做什么的?
最佳答案
gld/st_throughput
包括由 L1 和 L2 缓存提供服务的事务。而dram_read/write_throughput
是L2和设备内存之间的吞吐量。因此,每个全局内存访问都计入 gld/st_throughput
,但只有错过 L1 和 L2 缓存的请求才计入 dram_read/write_throughput
。
我还没有在任何地方找到关于柜台的详细概述。希望 NVIDIA 能够提供...
关于memory - "gld/st_throughput"和 "dram_read/write_throughput"指标有什么区别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13840328/