我正在使用动态并行 实现一个程序。每当我编译代码时,它都会抛出如下 fatal error :
ptxas fatal : Unresolved extern function 'cudaGetParameterBuffer'
编译如下:
nvcc -o dyn_par dyn_par.cu -arch=sm_35
如何解决?
最佳答案
cudaGetParameterBuffer
是 cudadevrt
库的一部分,您需要在编译器命令中指定它并指定 --relocatable-device-code
确实如此
nvcc -o dyn_par dyn_par.cu -arch=sm_35 -lcudadevrt --relocatable-device-code true
看看 CUDA Dynamic Parallelism Programming Guide从 Nvidia(第 21 页描述了上面)获取更多信息
关于cuda - 编译cuda程序时出现 fatal error ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17402227/