google-cloud-platform - Datalab - 如何安装和保存包

标签 google-cloud-platform google-cloud-datalab

我决定尝试在我正在开发的一个小项目中使用 Google Cloud Datalab,而不是在 AWS 实例上的 Anaconda 环境中使用 Jupyter Notebook。

如何将软件包(例如 OpenCV)安装到 Datalab VM 上,这样我就不必每次重新启动 VM 时都重新安装它?为什么每次重新启动后软件包都会消失,但更新的笔记本仍然存在?任何帮助回答这些问题并阐明 Datalab VM 工作原理的帮助都会非常有帮助。

最佳答案

笔记本存储在 Docker 卷装载中,该卷装载表示永久磁盘上在虚拟机重新启动时维护的位置。

但是,您安装的软件包存储在正在运行的容器中,因此在每次重新启动时都会丢失。

您可以创建一个自定义 Docker 镜像并使用它。在 datalab create 命令中,请参阅 --image-name 参数。

以下是您要使用的 Dockerfile 示例:

FROM gcr.io/cloud-datalab/datalab:latest
RUN pip install opencv

请注意,您需要使用此 docker 文件构建 docker 镜像,并将该镜像推送到 Google Container Registry。我对此的内存有点模糊,但该图像可能需要标记为公开。

希望有帮助!

关于google-cloud-platform - Datalab - 如何安装和保存包,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46678137/

相关文章:

hive - 在 Datalab 中查询 Hive 表时出现问题

python - 如何将数据帧从 Cloud Datalab 导出到 BigQuery 表?

docker - 无法直接在 GKE pod 中挂载 google filestore(不使用 PV)

java - Jersey JAX-RS @Suspished 注释在 GAE 标准环境中不起作用

python - Google Cloud Function 无法安装 python 包

google-api-python-client - 使用 Google 数据实验室读取文件

php - 我可以使用开发人员 key 在没有 Oauth 的情况下通过 Google Sheets API 写入 Google Sheet 吗?

google-cloud-platform - Google Stackdriver Logging 在 Google Cloud Shell 和 GKE 中不起作用

google-sheets - 通过 pandas_gbq 将 bigquery 谷歌表联合数据源读取到云数据实验室的问题