forms - 如何查找扫描文档图像上的空白字段

标签 forms image-processing ocr fax image-recognition

我希望我的申请能够填写表单中的一个字段 以黑白图像文件形式存在。形式总是 开始时是相同的纸质版本,但到了我的 应用程序从我的用户那里获取它,它可能已被扫描或传真更多 比一次。因此,我需要的字段不在 每个文件中的相同位置。

我的用户并不总是从我这里得到空白表格,所以我不 有能力打印我可以的标记或占位符 稍后再认识。

原来的空白表格上有文字,但是因为可能 已经传真了,我的分辨率只有200 dpi。文本 总是大到足以让人阅读,但我对此表示怀疑 关于OCR。

我有一些预算,所以我不需要免费的解决方案......让我们 就说 2000 美元。

也就是说,我正在考虑

  1. 获取 OCR 解决方案来查找文本 我需要的字段上的标签。我不 认为我有资源或 自己的专业知识。我不 需要完美的认可,因为我 已经知道文字说了什么。 但我确实需要知道 X- 和 Y 坐标。有软件吗 是这样的吗?还是编程比我想象的容易?

  2. 构建或购买软件来识别 表格的边缘。从那里, 我可以获得的相对位置 我需要的领域。我在想 我的扫描仪软件在图像周围放置的虚线 一个小文件。这是一个已知的 算法或者是否有可用的 解决方案?

  3. 其他一些识别方法 我需要的领域。尝试谷歌 表格填写软件给我 数百个网络表单匹配项, pdf 表格等不符合我的要求 需要。

我对语言不挑剔。我的应用程序在 Linux 上运行,但如果最好的解决方案是 Microsoft,我也许可以实现这一点。

非常感谢您的想法。

最佳答案

如果我理解正确的话,表格总是相同的,但可能会因复印/传真而移动、缩放或稍微旋转。在这种情况下,您的问题是图像配准之一:找到最佳的刚性变换,使用户的表单与您的“模型”表单对齐,其中您知道字段的位置兴趣。一旦知道了转换,您就可以计算该字段在用户表单中的位置。

有许多图像配准算法,通常是为对齐大脑 MR 图像等应用而开发的。它们的计算成本很高并且需要统计先验。幸运的是,您的情况更简单:您所需要做的就是在用户表单的内容周围放置一个矩形。坐标下降应该有效。您需要对噪音(表单外的垃圾)有一定的容忍度。

关于forms - 如何查找扫描文档图像上的空白字段,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/548309/

相关文章:

image - [图像处理]阈值不能忽略透明像素

python - 如何重新排序像素

opencv - 将背景颜色从白色更改为黑色时出错

javascript - Damerau-Levenshtein 距离实现

windows-phone-7.1 - 超正方 Windows Phone

php - Symfony2 Sonata 管理员根据所选值动态更改输入数据

angularjs - 整个表单的类似 ngChange 的功能

javascript - jQuery 不接受编程 element.onchange() 调用

android - Android 中的 OCR(图像转文本)

JavaScript 表单验证错误