logging - 为什么 Cloudwatch 停止记录 Sagemaker?

标签 logging amazon-cloudwatch amazon-cloudwatchlogs amazon-sagemaker

我有一个 Sagemaker 实例正在运行一段时间。期间我没有更改任何内容,但现在我在 Cloudwatch 上看不到新日志了。旧日志仍然存在,但 2 天以来没有新日志。

Sagemaker 实例仍在运行。只是不再记录了。由于代码没有改变,而且里面没有任何依赖于时间的东西,所以我很确定我达到了极限。但我不知道是哪一个:

  • 日志组只有一个日志流
  • 单个日志流的大小为 175MB。

我找到了CloudWatch Logs LimitsCloudWatch Events Limits ,但这对我没有帮助。

可能是什么问题?我该如何调查它?

根据AWS docs这不应该发生。一般的 AWS 支持没有帮助。

最佳答案

首先,听起来你并没有做错什么。日志应该直接显示在 CloudWatch 中,您无需执行任何操作,也没有大小或时间限制。如果它们完全启动,那么我们就知道权限设置正确 - 除非您在运行过程中修改了 IAM。如果日志在作业中停止,则可能是实际作业由于某种原因停止输出到 stdout/stderr,或者这是服务日志处理的操作故障。联系 AWS 支持人员(在此处、AWS 论坛或通过技术支持)是处理此问题的正确方法 - 向 AWS 中的人员提供账户 ID 和作业名称将使他们能够准确调查发生的情况。

另外,很抱歉这个问题这么长时间都没有得到答复。从这里的事件来看,似乎很多人都遇到过这个问题。但我也猜测并希望问题是暂时的内部服务故障,并且已经解决。如果有人仍然看到这个问题(2018 年 10 月之后),请发表评论,以便我们知道它仍然需要关注。或者更好的是提出一个新问题(从 SO 的角度来看并不理想,但这更有可能引起 AWS 某人的注意)。

感谢您使用 Amazon SageMaker,并感谢您的反馈!

-AWS 员工

关于logging - 为什么 Cloudwatch 停止记录 Sagemaker?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49940262/

相关文章:

java - java.util.logging.Logger 方法是否会在 Google App Engine 上失败?

amazon-web-services - 有没有办法跟踪 API 网关限制的调用?

amazon-web-services - AWS Elastic Beanstalk : Custom Cloudwatch Logs not showing despite IAM permissions and custom config

amazon-web-services - 为 kinesis firehose cloudformation 启用 cloudwatch 日志

amazon-web-services - 是否有一种可接受的方法可以从单个 AWS Lambda 函数记录到多个日志组?

java - Jboss 标准输出时间戳

python - 动态地打印到同一控制台行

logging - 尾多条日志流利

amazon-web-services - 使用 AWS CDK 进行跨账户监控

aws-lambda - 为 Lambda 函数设置 CloudWatch 日志组的到期时间