我在 Sagemaker 中构建了一个自定义模型,并通过 pickle 序列化了该模型。我想通过 Sagemaker 托管服务部署我的模型并阅读此内容
https://docs.aws.amazon.com/sagemaker/latest/dg/how-it-works-hosting.html
但我不知道如何使用当前未作为 Amazon Estimator 的一部分实现的算法为自定义模型构建自己的 Docker 容器。
如何构建自己的 docker 镜像以加载到 ECR 中,然后构建允许我创建端点的容器?
最佳答案
它展示了如何为训练作业和端点部署创建容器。
如果您只需要部署Endpoint,则可以跳过训练部分。
如文档中所述,对于 SageMaker 端点,您需要一个带有 Web 服务器的 Docker 容器,该容器实现了监听路由“/ping”和“/incalls”处的 HTTP 请求。 在指南中,他们使用 NGINX 和 Gunicorn 实现了 Flask Web 服务器。
在此目录中,您可以跳过“train”文件并保持除“predictor.py”文件之外的其余文件不变。您将修改该文件以实现您自己的推理算法。
关于docker - 如何为 Sagemaker 创建一个不属于 amazon 估算器一部分的 docker 镜像来创建端点?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55386981/