azure-machine-learning-service - 如何深入了解 AzureML 端点部署的异常和日志记录

标签 azure-machine-learning-service

由于我的 InferenceConfig 中的错误 score.py 文件,Model.Deploy 无法使用 ACI 进行 Azure 机器学习。我想在云中创建端点,但我在门户中看到的唯一状态是不健康。我用于部署模型的本地脚本(使用 )一直运行,直到超时。 (使用 service.wait_for_deployment(show_output=True) 语句)。

是否有选项可以更深入地了解部署变为“不健康”的实际原因/错误消息?

最佳答案

通常超时是由评分脚本中的 init() 函数错误引起的。您可以使用 print(service.get_logs()) 获取详细日志以查找 Python 错误。

有关更全面的故障排除指南,请参阅:

https://learn.microsoft.com/en-us/azure/machine-learning/how-to-troubleshoot-deployment

关于azure-machine-learning-service - 如何深入了解 AzureML 端点部署的异常和日志记录,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60638587/

相关文章:

python - 在 Azure ML Pipeline 的 train.py 中读取/安装 csv 文件

azure - 在 Azure Ml studio 上使用 jupyter 笔记本将数据写入数据存储

python - 如何在 Azure 机器学习管道中对使用 U-SQL 脚本生成的结果运行 Python 脚本?

r - Microsoft Azure ML 中的插入符包

azure - Tensorflow gpu 似乎无法在 Azure 机器学习 GPU 计算上运行

azure - 通过带有机器学习 Azure 数据的仪表板提供支持

azure - AzureML 中特征类型的作用是什么?

azure - Azure 机器学习端点的 API key

azure - 从 Azure Blob 存储到计算目标的数据传输速度缓慢

python - 如何避免 az ml run --submit-script 命令中出现错误 "conda --version: conda not found"?