我们的组织正在将日常工作迁移到 Azure 云平台。我的工作之一是使用 Python 读取许多 pdf 文件并将所有文本/非结构化数据转换为表格,例如 第一列显示文件名,第二列保存所有文本数据等。
只是想知道Azure平台中是否有一个服务可以自动实现这一点?我是 Azure 的新用户,所以对此不太熟悉。如果有帮助的话,非常感谢。
最佳答案
我建议查看Azure AI Document Intelligence (以前称为 Azure 表单识别器)。您可以训练它识别表格并从 PDF 文件中提取数据。
关于azure - 是否有 Azure 平台服务可以将 pdf 文件转换为文本并将这些非结构化数据保存在数据库中?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/73465616/