我一直在玩 NVIDIA 分析器 (nvprof),有两个我不明白的特定指标:
inst_inter_thread_communication
Number of inter-thread communication instructions executed by non-predicated threads
inst_misc
Number of miscellaneous instructions executed by non-predicated threads
我只是想知道哪些指令是线程间通信指令,哪些指令属于杂项。
引用:
http://docs.nvidia.com/cuda/profiler-users-guide/#metrics-reference
最佳答案
分为两类的 SASS 指令如下:
inst_inter_thread_communication
inst_misc
文档 CUDA 二进制实用程序 科Instruction Set Reference包含对 SASS 指令的简要说明。 SASS 和 PTX 之间存在接近 1:1 的关系,因此您还可以查看 PTX ISA手动的。
关于cuda - CUDA中的杂项和线程间通信指令,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25670827/