cuda - 编译cuda程序时出现 fatal error

标签 cuda nvidia

我正在使用动态并行 实现一个程序。每当我编译代码时,它都会抛出如下 fatal error :

ptxas fatal : Unresolved extern function 'cudaGetParameterBuffer'

编译如下:

nvcc -o dyn_par dyn_par.cu -arch=sm_35

如何解决?

最佳答案

cudaGetParameterBuffercudadevrt 库的一部分,您需要在编译器命令中指定它并指定 --relocatable-device-code确实如此

nvcc -o dyn_par dyn_par.cu -arch=sm_35 -lcudadevrt --relocatable-device-code true

看看 CUDA Dynamic Parallelism Programming Guide从 Nvidia(第 21 页描述了上面)获取更多信息

关于cuda - 编译cuda程序时出现 fatal error ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17402227/

相关文章:

c++ - 矩阵乘法在 CUDA 上给出了错误的结果

opencv - 从 Cuda 设备指针创建 OpenCV/EmguCV GpuMat

opencv - 如何在 opencv 中使用 gpu::pyrdown?

ubuntu - PyOpenCL 找不到设备

cuda - CUDA工具包和CUDA sdk有什么区别

c++ - 调用 __syncthreads() 的最佳位置

tensorflow - 使用旧版本的 CUDA 和 cuDNN 安装 GPU 版本的 Tensorflow

c++ - cuda可以结合activeX技术使用吗?

cuda - 为什么 CUDA 对线程使用的寄存器数量进行四舍五入?

c++ - 将 cuda 推力与数组一起使用而不是 vector 到 inclusive_scan