我在 GTX 1080 Ti 和 RTX 2080 Ti 上运行相同的程序。我发现当我尝试使用 Cuda-memcheck 工具检查我的程序时,基于设备 RTX 2080 Ti 总是出现以下错误。
========= CUDA-MEMCHECK
========= Program hit cudaErrorInvalidValue (error 11) due to "invalid argument" on CUDA API call to cudaFuncSetAttribute.
========= Saved host backtrace up to driver entry point at error
========= Host Frame:/usr/lib/x86_64-linux-gnu/libcuda.so.1 [0x359363]
========= Host Frame:/usr/local/cuda/lib64/libcublas.so.10.0 [0x79a03c]
========= Host Frame:/usr/local/cuda/lib64/libcublas.so.10.0 [0x72c2ab]
========= Host Frame:/usr/local/cuda/lib64/libcublas.so.10.0 [0x72c610]
========= Host Frame:/usr/local/cuda/lib64/libcublas.so.10.0 (cublasCreate_v2 + 0x1ce7) [0x14b337]
========= Host Frame:./GPU_LMM (main + 0x43) [0xb633]
========= Host Frame:/lib/x86_64-linux-gnu/libc.so.6 (__libc_start_main + 0xe7) [0x21b97]
========= Host Frame:./GPU_LMM (_start + 0x2a) [0xb77a]
=========
========= Program hit cudaErrorInvalidValue (error 11) due to "invalid argument" on CUDA API call to cudaGetLastError.
========= Saved host backtrace up to driver entry point at error
========= Host Frame:/usr/lib/x86_64-linux-gnu/libcuda.so.1 [0x359363]
========= Host Frame:/usr/local/cuda/lib64/libcublas.so.10.0 [0x79deb3]
========= Host Frame:/usr/local/cuda/lib64/libcublas.so.10.0 [0x72c2b8]
========= Host Frame:/usr/local/cuda/lib64/libcublas.so.10.0 [0x72c610]
========= Host Frame:/usr/local/cuda/lib64/libcublas.so.10.0 (cublasCreate_v2 + 0x1ce7) [0x14b337]
我确保此时所做的只是创建 Cublas 上下文,而不执行任何操作。我不确定问题是什么。是否是CUDA 10.0与RTX 2080 Ti版本不匹配导致的?
我的服务器信息如下。 NVIDIA-SMI 410.93 驱动程序版本:410.93 CUDA 版本:10.0
最佳答案
最新的 CUDA 版本 10.0.130 应支持 RTX2080 Ti 确保您的驱动程序也是最新的。
在 Linux 上,驱动程序版本 >= 410.48,在 Windows 上 >= 411.31
CuBlas 在版本 10 中也获得了图灵支持。
关于cuda - RTX 2080 Ti cuda-memcheck 在创建 Cublas 上下文开始时遇到错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54452357/