c# - 如何以编程方式读取扫描的文档或图像

标签 c# java image-processing ocr image-recognition

我在网上搜索了一下,因为我对 OCR 有点一窍不通,实际上我不确定从哪里开始比较好。

我想构建一个能够识别和计数的应用程序,例如在任何给定的文档/图像行上填写了多少个复选框(如果有人知道的话,它甚至可以是另一种格式)会更好地适应这种类型的应用程序)。最终目标是消除手动数据捕获并加快将总体统计数据提供给应用程序最终用户的过程

我主要使用 C# 编写代码,因此 .net 解决方案会更可取,但如果不是,我会尽我所能。

我的想法是将用户填写的表单重新设计为与此类似的内容。 (请原谅粗糙的 ASCII 艺术 :P)所以填写表格的人只需检查纸上的一个值。

                |  1  |  2  |  3  |  4  |  5  |  
Product A       | [ ]   [ ]   [ ]   [ ]   [x] |    
Product B       | [ ]   [ ]   [x]   [ ]   [ ] |

任何想法将不胜感激

谢谢!

最佳答案

1) 您还可以查看免费但​​功能强大的 Tesseract文字识别引擎。它是用 C++ 编写的,但您可以使用 C# 轻松地与之交互。

2) 如果您想自己动手处理图像,可以考虑使用 EmguCV库,它是 OpenCV 的 .NET 包装器.

最近有一个post在 opencv-tag 上,它试图解决与您的问题非常相似的问题,即检测乐透卡上的标记。

关于c# - 如何以编程方式读取扫描的文档或图像,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8576652/

相关文章:

c# - 获取/设置除 Id 和 Text 以外的 Kendo Treeview 节点的属性

c# - 找出声明为父类(super class)的实例的子类类型

java - 检查结果是否是一个好的 playframework

java - 旋转和缩放——如何同时进行并获得正确的结果?

matlab - opencv中是否有等同于matlab conv2的函数

c# - 阻止默认发送按钮功能并仅在 Outlook 中执行自定义操作

c# - 在 C# 的 OrderBy 方法中指定参数

java - java中一个字符串的最大字符数

python - 如何应用适当的阈值以去除二元板上的边缘

python - 在opencv和python中复制图像的一部分