我目前正在尝试进行相当长的超参数网格搜索(4-5 小时),但我在 gcp 笔记本实例上一直遇到 Jupyter Lab 问题(或尚未弄清楚某些问题)。与笔记本电脑的浏览器连接不断断开,而训练过程却继续正常进行。当它完成训练过程时,由于与笔记本的浏览器连接已经断开,因此无处可写输出。
即使我的笔记本电脑关闭/被关闭,我怎样才能保持该连接处于事件状态或确保输出写入笔记本电脑?
最佳答案
有多个问题可能会影响您的笔记本电脑。这可能是 GCP 问题、网络问题...因此,您需要提供更多信息才能诊断发生的情况。我建议您向 GCP 或 Jupyter 支持开具票证,以进行更彻底的调查,因为这可能很难诊断,而且他们将有更多工具来完成此工作。另外,@Joaquim 建议的目前看来是一个很好的解决方法。无论如何,我收集了几个故障排除步骤,您可以按照这些步骤来确定这是否是影响您的反复出现的问题之一:
根据this Jupyter Notebook document ,有一个“shutdown_no_activity_timeout”选项。默认值为“0”,禁用此自动关闭。该选项可能会在“jupyter_notebook_config.py”文件上被覆盖。您可以按照以下步骤进行确认:
- 单击 AI Platform Notebooks page 上运行您的笔记本的实例名称.
- 通过点击“SSH”远程访问
- 在 shell 上运行此命令以确认覆盖是否存在:
ls/home/*/.jupyter/jupyter_notebook_config.py
- 运行此命令以确认 shutdown_no_activity_timeout 选项是否正在执行覆盖操作:
cat/home/*/.jupyter/jupyter_notebook_config.py |
cat/home/*/.jupyter/jupyter_notebook_config.py | grep shutdown_no_activity_timeout
- 如果设置为不同的值,则将该选项切换为“0”,并重置 this page 上的笔记本实例应用更改。
根据this other document ,在代理后面时可能无法连接。您可以尝试disable your browser’s proxy settings .
您还可以尝试更改 Jupyter 端口。上 this Jupyter issue ,客户坚称更换后断线问题消失了。如果您使用的是 Chrome 浏览器,请打开检查面板(Ctrl+Shift+I)并将您的连接症状与 this image 进行比较?如果遇到类似错误,您可以尝试更改端口(c.NotebookApp.port)。
关于google-cloud-platform - 浏览器在模型训练期间断开连接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59391254/