azure - 是否有 Azure 平台服务可以将 pdf 文件转换为文本并将这些非结构化数据保存在数据库中?

标签 azure azure-data-factory azure-analysis-services

我们的组织正在将日常工作迁移到 Azure 云平台。我的工作之一是使用 Python 读取许多 pdf 文件并将所有文本/非结构化数据转换为表格,例如 第一列显示文件名,第二列保存所有文本数据等。

只是想知道Azure平台中是否有一个服务可以自动实现这一点?我是 Azure 的新用户,所以对此不太熟悉。如果有帮助的话,非常感谢。

最佳答案

我建议查看Azure AI Document Intelligence (以前称为 Azure 表单识别器)。您可以训练它识别表格并从 PDF 文件中提取数据。

关于azure - 是否有 Azure 平台服务可以将 pdf 文件转换为文本并将这些非结构化数据保存在数据库中?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/73465616/

相关文章:

node.js - CentOS + Node.js (v8.15.0) + Sequelize (v4.38.0) 到 Azure SQL 间歇性连接问题

Azure 数据库导出 - 不支持高级版

azure-data-factory - 如何保存数据工厂存储过程输出

Azure Blob 创建未触发 Azure 数据工厂事件触发器

azure - 使用托管标识和基于 token 的登录从 Azure Function 访问 Azure Analysis Services

json - 如何合并两个 ARM 模板 JSON 参数文件并覆盖重复参数?

Azure 数据工厂 - 复制事件映射

azure - Analysis Service 表格多维数据集刷新状态检查

azure - 将 Power BI 数据源从 Excel 切换到 Azure 分析服务

.net - Azure 应用服务的响应非常慢