python - 如何使用OCR提取指定位置的文本信息?

标签 python node.js artificial-intelligence ocr

用户上传表格数据,其中包含类(class)、教授、日程安排等信息。

我想轻松提取该信息。

我可以使用 OCR 库,但它只会输出随机混合的文本。

我不知道某样东西属于什么。

有没有一种方法可以训练 OCR 一点点,只查看图像(表单)的某些部分,然后标记数据,以便在提取数据时全部标记出来。等等

假设我有一个包含大量数据的表单,我希望它只查看地址部分并为其添加标签。

或者像数据一样的电子表格,我希望它按列对其进行标记。

简单地将所有文本提取到字符串中并不是很有用。

最佳答案

如果每个文档都具有相同的格式。 尝试将文档分解为单独的部分,然后将您需要文本的部分提供给 OCR。 如果没有,祝你好运,我也在寻找答案。

关于python - 如何使用OCR提取指定位置的文本信息?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45622805/

相关文章:

node.js - 有没有办法使用 npm Sequelize 向 SQL Server 插入超过 150K 的记录?

algorithm - AO*算法如何实现?

c - 具有全局值的回溯的递归差异?

c++ - 三边测量(2D)算法实现

javascript - Node js 中的异步函数处理

node.js - yarn -如何将package.json中的每个依赖关系更新为最新版本?

python - 在 Raspbian 上自动启动程序 - Raspberry Pi 3

python - docker Airflow 配置问题 (puckel/docker)

python - 使用 mysql python 模块更新 SQL 表

python - 使用 Python 标准化 JSON