google-cloud-platform - 浏览器在模型训练期间断开连接

标签 google-cloud-platform jupyter-notebook jupyter-lab gcp-ai-platform-notebook

我目前正在尝试进行相当长的超参数网格搜索(4-5 小时),但我在 gcp 笔记本实例上一直遇到 Jupyter Lab 问题(或尚未弄清楚某些问题)。与笔记本电脑的浏览器连接不断断开,而训练过程却继续正常进行。当它完成训练过程时,由于与笔记本的浏览器连接已经断开,因此无处可写输出。

即使我的笔记本电脑关闭/被关闭,我怎样才能保持该连接处于事件状态或确保输出写入笔记本电脑?

最佳答案

有多个问题可能会影响您的笔记本电脑。这可能是 GCP 问题、网络问题...因此,您需要提供更多信息才能诊断发生的情况。我建议您向 GCP 或 Jupyter 支持开具票证,以进行更彻底的调查,因为这可能很难诊断,而且他们将有更多工具来完成此工作。另外,@Joaquim 建议的目前看来是一个很好的解决方法。无论如何,我收集了几个故障排除步骤,您可以按照这些步骤来确定这是否是影响您的反复出现的问题之一:

  1. 根据this Jupyter Notebook document ,有一个“shutdown_no_activity_timeout”选项。默认值为“0”,禁用此自动关闭。该选项可能会在“jupyter_notebook_config.py”文件上被覆盖。您可以按照以下步骤进行确认:

    • 单击 AI Platform Notebooks page 上运行您的笔记本的实例名称.
    • 通过点击“SSH”远程访问
    • 在 shell 上运行此命令以确认覆盖是否存在: ls/home/*/.jupyter/jupyter_notebook_config.py
    • 运行此命令以确认 shutdown_no_activity_timeout 选项是否正在执行覆盖操作: cat/home/*/.jupyter/jupyter_notebook_config.py | cat/home/*/.jupyter/jupyter_notebook_config.py | grep shutdown_no_activity_timeout
    • 如果设置为不同的值,则将该选项切换为“0”,并重置 this page 上的笔记本实例应用更改。
  2. 根据this other document ,在代理后面时可能无法连接。您可以尝试disable your browser’s proxy settings .

  3. 您还可以尝试更改 Jupyter 端口。上 this Jupyter issue ,客户坚称更换后断线问题消失了。如果您使用的是 Chrome 浏览器,请打开检查面板(Ctrl+Shift+I)并将您的连接症状与 this image 进行比较?如果遇到类似错误,您可以尝试更改端口(c.NotebookApp.port)。

关于google-cloud-platform - 浏览器在模型训练期间断开连接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59391254/

相关文章:

javascript - Jupyter Lab 隐藏垂直导航 Pane

docker - 无法在 docker 容器中运行的远程 Jupyter 服务器上保存文件

java - Blob 已创建,但文件未使用 SignedURL 上传

scala - 在 Dataproc 上运行 Spark + Scala + Jupyter

python - IPython 笔记本 : How to write cell magic which can access notebook variables?

python - Pandas 数据框将长字符串列动态操作为 2 列

google-cloud-datastore - Google Cloud 函数环境变量

javascript - 如何从 Javascript 安全地调用 Google Cloud Run 服务?

docker - Kubernetes - 从服务端点自动填充 CloudDNS 记录

html - 如何更改 IPython 笔记本中的 DataFrame 打印样式