我如何使用并行 nsight 知道非合并读/写和存储区冲突的数量?
此外,当我使用 nsight 是一个分析器时我应该看什么?哪些重要字段可能会导致我的程序变慢?
最佳答案
我不使用 NSight,但您将使用探查器查看的典型字段基本上是:
- 内存消耗
- 花在功能上的时间
更具体地说,使用 CUDA,您将注意 GPU 的占用情况。
其他有趣的值是编译器设置局部变量的方式:在寄存器中或在本地内存中。
最后,您将检查将数据传入和传出 GPU 所花费的时间,并将其与计算时间进行比较。
关于c++ - 使用 Nsight 确定银行冲突和合并,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6574814/