我正在尝试分析我的 tensorflow 应用程序。训练运行良好,但如果我在 Tensorboard 中打开 Profile-Tab,我会得到 Failed to load libcupti (is it installed and accessible?)
。
我的配置是:
- Windows 10
- python 3.9.7
- tensorflow 2.6.0
- CUDA 工具包 11.2
- cuDNN 8.1.1(按照说明复制文件安装为 here)
- Visual Studio 专业版 2019
CUDA_PATH
是 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2
我的路径变量包含:
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\bin
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\libnvvp
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\extras\CUPTI\lib64
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\include
C:\Program Files\NVIDIA Corporation\Nsight Systems 2020.4.3\target-windows-x64
conda list
(仅相关包):
cudatoolkit 11.3.1 h59b6b97_2
cudnn 8.2.1 cuda11.3_0
tensorboard 2.6.0 py_1
tensorboard-data-server 0.6.0 py39haa95532_0
tensorboard-plugin-profile 2.5.0 pypi_0 pypi
tensorboard-plugin-wit 1.6.0 py_0
tensorflow 2.6.0 gpu_py39he88c5ba_0
tensorflow-base 2.6.0 gpu_py39hb3da07e_0
tensorflow-datasets 4.5.2 pypi_0 pypi
tensorflow-estimator 2.6.0 pyh7b7c402_0
tensorflow-gpu 2.6.0 h17022bd_0
tensorflow-metadata 1.6.0 pypi_0 pypi
令我惊讶的是,Anaconda 安装了 CUDA Toolkit 11.3 版和 cuDNN 8.2.1 版。 根据GPU-configurations这应该是版本 11.2 和 8.1。这可能是问题所在吗?
或者有人知道如何解决这个问题?
最佳答案
隐藏在 jupyter 的日志输出中,我发现了一条错误消息:Could not load dynamic library 'cupti64_113.dll': dlerror: cupti64_113.dll not found
有了这个错误信息和that hint我能够解决问题:
我将 cupti64_2020.3.0.dll
复制到 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\extras\CUPTI\lib64
并将其重命名为 cupti64_113.dll
现在分析器可以工作了。
关于python - Tensorboard 分析器 : Failed to load libcupti (is it installed and accessible? ),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/71023977/