在做 Udacity 深度学习作业时,我遇到了内存问题。我需要切换到云平台。我以前使用过 AWS EC2,但现在我想尝试 Google Cloud Platform (GCP)。我至少需要 8GB 内存。我知道如何在本地使用 docker,但从未在云端尝试过。
- 有没有现成的解决方案可以在 GCP 上运行 Tensorflow?
- 如果没有,哪种服务(Compute Engine 或 Container Engine)可以让您更轻松地开始使用?
- 如有任何其他提示,我们也将不胜感激!
最佳答案
总结答案:
- AI Platform Notebooks - 一键Jupyter Lab环境
- Deep Learning VMs images - 预装机器学习库的原始虚拟机
- Deep Learning Container Images - DLVM 镜像的容器化版本
- Cloud ML
- 在 Compute Engine 上手动安装。请参阅下面的说明。
在 Compute Engine 上手动运行 TensorFlow 的说明:
- Create a project
- 打开Cloud Shell (顶部的按钮)
- 列出机器类型:
gcloud 计算机器类型列表
。您可以更改我在下一个命令中使用的机器类型。 - 创建实例:
gcloud compute instances create tf \
--image container-vm \
--zone europe-west1-c \
--machine-type n1-standard-2
- 运行
sudo docker run -d -p 8888:8888 --name tf b.gcr.io/tensorflow-udacity/assignments:0.5.0
(将镜像名称更改为所需的名称) - 在 dashboard 中查找您的实例并编辑
默认
网络。 - 添加防火墙规则以允许您的 IP 以及协议(protocol)和端口
tcp:8888
。 - 从仪表板中查找实例的外部 IP。在浏览器中打开
IP:8888
。完成! - 完成后,删除创建的集群以避免产生费用。
我就是这样做的,而且成功了。我确信有一种更简单的方法可以做到这一点。
更多资源
您可能有兴趣了解更多信息:
- Google Cloud Shell
- Container-Optimized Google Compute Engine Images
- Google Cloud SDK获得响应速度更快的 shell 等等。
很高兴知道
- “即使在虚拟机终止并重新启动后,您的 Cloud Shell 主目录的内容也会在所有 Cloud Shell session 之间的项目中持续存在”
- 要列出所有可用的镜像版本:
gcloudcomputeimageslist --project google-containers
感谢@user728291、@MattW、@CJCullen 和@zain-rizvi
关于tensorflow - 哪种 Google Cloud Platform 服务最容易运行 Tensorflow?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36916690/