python - AWS elastic beanstalk 上的 tensorflow GPU - 调用 "python"+ "sudo"时出现 tf 导入错误(libcublas.so.9.0 错误)

标签 python linux amazon-web-services tensorflow

我得到了

“导入错误:libcublas.so.9.0:无法打开共享对象文件:没有这样的文件或目录”

当我使用“sudo python3.6 ...”调用我的应用程序时出现错误,但当我仅调用“python3.6 ...”时则不会出现错误

elastic beanstalk 使用“sudo”,因此无法删除该命令。

只安装了 CUDA 9.0(这是我们环境的正确版本),并且/usr/local/cuda/lib64/libcublas.so.9.0 存在。

我们使用相同的配置和相同的 AMI ID 创建了一个单独的 ec2 实例:CUDA9ClassicAmazonLinuxDLAMIwithMXNetTensorflowandCaffe2,并且没有任何问题。这似乎是只存在于弹性 beantalk 中的问题。

$LD_LIBRARY_PATH = '/usr/local/cuda/lib64:/usr/local/lib:/usr/lib:/usr/local/cuda/extras/CUPTI/lib64:/usr/local/mpi/lib:/lib/:/home/ubuntu/src/caffe2/build:/home/ec2-user/src/caffe2/build:/usr/local/cuda/lib64:/usr/local/lib:/usr/lib:/usr/local/cuda/extras/CUPTI/lib64:/usr/local/mpi/lib:/usr/local/cuda/lib64:/usr/local/lib:/usr/lib:/usr/local/cuda/extras/CUPTI/lib64:/usr/local/mpi/lib:/lib/:/home/ubuntu/src/caffe2/build:/home/ec2-user/src/caffe2/build:/usr/local/cuda/lib64 :/usr/local/lib:/usr/lib:/usr/local/cuda/extras/CUPTI/lib64:/usr/local/mpi/lib:'

$PATH = '/usr/local/cuda/bin:/usr/local/bin:/opt/aws/bin:/usr/local/mpi/bin:/home/ubuntu/src/caffe2/build:/home/ec2-user/src/caffe2/build:/usr/local/cuda/bin:/usr/local/bin:/opt/aws/bin:/usr/local/mpi/bin:/usr/local/cuda/bin:/usr/local/bin:/opt/aws/bin:/usr/local/mpi/bin:/home/ubuntu/src/caffe2/build:/home/ec2-user/src/caffe2/build :/usr/local/cuda/bin:/usr/local/bin:/opt/aws/bin:/usr/local/mpi/bin:/usr/local/bin:/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/sbin:/opt/aws/bin:/home/ec2-user/.local/bin:/home/ec2-user/bin'

有什么想法吗?

最佳答案

中添加一个用于设置新库(在您的情况下为CUDA)的路径的文件
/etc/ld.so.conf.d/foo.conf

文件内容为CUDA库路径(/usr/local/cuda/lib64)

然后打电话

 sudo ldconfig 

确保库包含在环境中。

关于python - AWS elastic beanstalk 上的 tensorflow GPU - 调用 "python"+ "sudo"时出现 tf 导入错误(libcublas.so.9.0 错误),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51509046/

相关文章:

php - 实例化从 AwsClient 子类扩展的类时出错

python - 如何在第一次匹配后停止匹配文件行

python - 将两个字典组合成一个列表

python - Python 优化(-O 或 PYTHONOPTIMIZE)有什么作用?

python - 跨进程共享 psycopg2/libpq 连接

linux - pthread_mutex 的 "default mutex attributes"是什么**

python - Scikit-Learn的SVM类中的nu参数是什么意思?

linux - awk 忽略打印单列。 sh-c

python - 在亚马逊 lambda python 中运行 selenium webdriver

mysql - 这是否可以将流量分配到我的 RDS 只读副本?