CUDA:注入(inject)我自己的 PTX 函数?

标签 cuda gpu

我希望能够使用 PTX 1.3 中尚未在 C 接口(interface)中实现的功能。有没有办法在 PTX 中编写我自己的函数并注入(inject)到现有的二进制文件中?

我正在寻找的功能是获得 %smid 的值

最佳答案

答案:

__noinline__ __device__ uint get_smid(void)
{
    uint ret;
    asm("mov.u32 %0, %smid;" : "=r"(ret) );
    return ret;
}

关于CUDA:注入(inject)我自己的 PTX 函数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2983553/

相关文章:

c++ - 我使用 cudaMemcpy 错了吗?

c++ - 重复的可变参数模板参数

c++ - 带有 cmake 的 CUDA。找不到配置文件

c++ - CUDA cudaMemcpy 数组结构

cuda - 如何使用 Nvidia 多进程服务 (MPS) 运行多个非 MPI CUDA 应用程序?

matrix - 使用 tensorflow 矩阵乘法测试 GPU

python - 无法在 docker 容器内加载动态库 'libcudart.so.11.0'

c++ - 换显卡后需要重新安装cuda吗

c++ - 是否可以将功能卸载到显卡?

c++ - 在结构中使用 Vulkan 唯一句柄会导致 "implicitly deleted"错误