amazon-web-services - 使用 Go 将 S3 文档发送到 Textract

标签 amazon-web-services go amazon-textract

我正在尝试使用 Go 将 S3 存储桶中的对象发送到 Textract 并收集响应。

我正在使用 aws go sdk 包并能够连接到我的 S3 存储桶并列出其中包含的所有对象。到目前为止,一切都很好。我现在需要能够将其中一个对象(一个 .pdf 文件)发送到 Textract 并收集响应。

用于与 Textract 交互的 AWS Go SDK 内容似乎相当广泛,但我找不到一个很好的例子来说明如何做到这一点。

如果能提供有关如何执行此操作的示例或建议,我将不胜感激。

最佳答案

要开始一项工作,您可以调用 StartDocumentTextDetection , 使用 DocumentLocation指定文件,然后指定一个 SNS 主题,Textract 将在该主题中发布一条通知,当它完成处理您的作业时。

你现在有两种可能性:

  • 订阅 SNS 主题,当您收到消息时检索结果
  • 创建一个由 SNS 主题触发的 lambda 函数,用于检索结果。

第二个选项是 IMO 更好,因为它使用更少的计算时间(直到作业尚未完成才运行)。

要检索作业,您可以使用 GetDocumentTextDetection

关于amazon-web-services - 使用 Go 将 S3 文档发送到 Textract,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56719562/

相关文章:

xml - 使用 Go 并行读取多个 URL

amazon-web-services - Amazon Textract JSON 缺少一些页面

java - AWS texttract 提取元数据和置信度得分

amazon-web-services - 入口主机中的变量将转移到服务名称

amazon-web-services - 使用 AWS IoT 的设备是否应该只发布到它的影子?

azure - 上传 Blob 时可以设置访问层吗?如果是,那么该怎么做呢?

docker - 在 `go build` 命令中包含 .env 文件

python - 如何删除多个标题

amazon-web-services - AWS CodeBuild VPC_CLIENT_ERROR : Unexpected EC2 error: UnauthorizedOperation

amazon-web-services - AWS EC2 云初始化脚本以 ec2-user 身份运行