cuda - 如何获取要执行的 PTX 文件

标签 cuda nvcc ptx

我知道如何从 .cu 生成 .ptx 文件以及如何从 生成 .cubin 文件.ptx。但我不知道如何获得最终的可执行文件。

更具体地说,我有一个 sample.cu 文件,它被编译为 sample.ptx。然后,我使用 nvcc 将 sample.ptx 编译为 sample.cubin。然而,这个.cubin文件如果没有主机代码则无法直接执行。如何将 .cubin 文件链接到我的原始 .cu 文件以生成最终的可执行文件?

最佳答案

您应该能够使用 cuModuleLoadDataEx 直接从 cuda 驱动程序 api 运行 ptx 代码。有一个例子here第 5 页

关于cuda - 如何获取要执行的 PTX 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4798278/

相关文章:

Opengl深度缓冲区到cuda

c++ - 什么可以编译得更快?每种方法的源代码和 header ,或者单个文件中的任何内容?

c++ - NVCC 警告级别

c - 是否可以将汇编指令放入 CUDA 代码中?

cuda - 为 infiniband 设置 GPUDirect

c++ - 默认情况下,exp的CUDA C++数学函数是否具有覆盖函数?

c++ - Cmake找不到cuda.h文件

haskell - 将 GHC 与 NVCC 一起使用

c++ - 将内核链接到 PTX 函数

cuda - 在 Nvidia 的 NVCC 编译器中使用多个 "arch"标志的目的是什么?