amazon-web-services - AWS Sagemaker : Jupyter Notebook kernel keeps dying

标签 amazon-web-services jupyter-notebook amazon-sagemaker

在 Sagemaker 上的 Jupyter 笔记本中运行一段代码时,我时不时会断开连接。我通常只是重新启动我的笔记本并再次运行所有单元格。但是,我想知道是否有一种方法可以在不丢失进度的情况下重新连接到我的实例。目前,底部栏显示“无内核”,但我的文件在内核 session 选项卡中似乎处于事件状态。我可以恢复笔记本的变量和内容吗?另外,有没有办法防止将来内核断开连接?

请注意,我恢复到 tornado = 5.1.1,这似乎减少了断开连接的次数,但它仍然时不时发生。

最佳答案

通常,断开连接是由于不活动造成的,因为作业长时间运行而没有用户输入。如果需要很长时间的预处理,您可以增加处理作业的实例大小以使其执行得更快,或者增加实例数。如果您使用的是 EMR,自 2021 年 12 月起,您现在可以直接在 EMR 集群上运行 EMR Spark 查询: https://aws.amazon.com/about-aws/whats-new/2021/12/amazon-sagemaker-studio-data-notebook-integration-emr/

这里有一个有用的博客 https://aws.amazon.com/blogs/machine-learning/build-amazon-sagemaker-notebooks-backed-by-spark-in-amazon-emr/这有助于您启动和运行。

如果您需要更多信息,请告诉我,如果有用,请投票给答案。 :-)

关于amazon-web-services - AWS Sagemaker : Jupyter Notebook kernel keeps dying,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65925975/

相关文章:

node.js - 如何运行sequelize db :migrate on Elastic Beanstalk EB with env vars? 如何访问容器命令中的.env vars?

python - 使用 jupyter notebook 运行 docker 镜像时出现问题

javascript - iPython/Jupyter 笔记本 : How to Embed Interactive Graph Using Desmos API?

java - 收集与多个 AWS 服务交互的 Java 应用程序的性能指标

java - AWS中的Kubernetes集群-哪些实例类型?

ruby - Amazon Load Balancer 断开与 TorqueBox 的 Web Socket 连接

python - 我无法在 anaconda 环境中安装 Jupyter 和 Matplotlib

aws-cloudformation - CDK 小写字符串标记跨堆栈引用

amazon-web-services - 语法错误(amazon-sagemaker-object-has-no-attribute)

amazon-web-services - 我正在尝试创建 AWS Sagemaker Pipeline。客户端错误: An error occurred (ValidationException) when calling the CreatePipeline operation: