java - 如何使用java中的OCR识别来自表单不同字段的表单数据?

标签 java ocr tesseract icr form-processing

here is the form

我有一个表单图像,其中包含不同的字段,如名称、号码、地址等。我想识别这些字段中的数据并将它们保存到数据库中。现在,我的 OCR 工作正常,但我不知道如何从图像中提取特定字段数据(名称、地址)以用于 OCR。我只是想知道如何识别输出文件中的字符来自名称字段或地址字段或任何其他字段。

最佳答案

由于您知道不同字段所在的表单的确切区域,因此您可以使用一些图像处理库裁剪图像并仅将特定区域发送到 OCR 引擎。

检查this SO question .

关于java - 如何使用java中的OCR识别来自表单不同字段的表单数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13488270/

相关文章:

ocr - 为什么我在 Tesseract 中收到 "tiff page 1 not found"Lebtonica 警告?

OpenCV 3.02 + 文本模块 + Tesseract 3.05 运行时错误 : Tesseract not found

ios - Tesseract OCR 无法识别从设备拍摄的图像

java - Thymeleaf 模板 :data=http://www. somesite.com || org.thymeleaf.exceptions.TemplateProcessingException:无法解析为分配序列

java - 如何使用斑马小程序在收据打印机中打印

java - 调用静态内容

ubuntu - pytesseract 占用 CPU 太高

java - 使用 chrome 远程运行 selenium 测试用例下载文件测试

pdf - 使用 C# 搜索 OCR(可搜索)PDF

c++ - 使用 GNU gprof 分析 tesseract-ocr