我决定尝试在我正在开发的一个小项目中使用 Google Cloud Datalab,而不是在 AWS 实例上的 Anaconda 环境中使用 Jupyter Notebook。
如何将软件包(例如 OpenCV)安装到 Datalab VM 上,这样我就不必每次重新启动 VM 时都重新安装它?为什么每次重新启动后软件包都会消失,但更新的笔记本仍然存在?任何帮助回答这些问题并阐明 Datalab VM 工作原理的帮助都会非常有帮助。
最佳答案
笔记本存储在 Docker 卷装载中,该卷装载表示永久磁盘上在虚拟机重新启动时维护的位置。
但是,您安装的软件包存储在正在运行的容器中,因此在每次重新启动时都会丢失。
您可以创建一个自定义 Docker 镜像并使用它。在 datalab create
命令中,请参阅 --image-name
参数。
以下是您要使用的 Dockerfile 示例:
FROM gcr.io/cloud-datalab/datalab:latest
RUN pip install opencv
请注意,您需要使用此 docker 文件构建 docker 镜像,并将该镜像推送到 Google Container Registry。我对此的内存有点模糊,但该图像可能需要标记为公开。
希望有帮助!
关于google-cloud-platform - Datalab - 如何安装和保存包,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46678137/