我问这个问题是因为我知道有一种方法可以使用二进制文件而不是源文件。
此外,我猜测使用汇编语言,模拟函数指针会更容易。除非GPU上的汇编与CPU上的完全不同。
最佳答案
您可能想看看 PTX。 NVIDIA 在 CUDA 4.0 文档中提供了描述它的文档。
http://developer.nvidia.com/nvidia-gpu-computing-documentation
NVIDIA 将 PTX 描述为“Ta 低级并行线程执行虚拟机和指令集架构 (ISA)。PTX 将 GPU 作为数据并行计算设备公开。”不完全像 x86 汇编,但您可能会发现它读起来很有趣。
关于assembly - CUDA有汇编语言吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7353136/