c++ - 使用 Nsight 确定银行冲突和合并

标签 c++ c debugging profiling cuda

我如何使用并行 nsight 知道非合并读/写和存储区冲突的数量?
此外,当我使用 nsight 是一个分析器时我应该看什么?哪些重要字段可能会导致我的程序变慢?

最佳答案

我不使用 NSight,但您将使用探查器查看的典型字段基本上是:

  • 内存消耗
  • 花在功能上的时间

更具体地说,使用 CUDA,您将注意 GPU 的占用情况。
其他有趣的值是编译器设置局部变量的方式:在寄存器中或在本地内存中。

最后,您将检查将数据传入和传出 GPU 所花费的时间,并将其与计算时间进行比较。

关于c++ - 使用 Nsight 确定银行冲突和合并,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6574814/

相关文章:

c++ - 如何将 int 从一个 .h 转换为另一个 .h

C++ 和 SDL 2 - 创建一个仅包含常量的 header :对 Constants::window 的 undefined reference

计算平均值返回错误结果

c - 未找到 string.h 文件

java - 添加 Java 异常断点在 Eclipse 中不显示任何匹配项

ios - 如何确定代码是否在 DEBUG/RELEASE build 中运行?

c++ - 对 RGB 图像执行阈值操作

c# - 字符串与字节数组,性能

c++ - 函数返回和使用 copyTo 中的 OpenCV Mat

安卓工作室 : run/debug release version of app