我在网上搜索了一下,因为我对 OCR 有点一窍不通,实际上我不确定从哪里开始比较好。
我想构建一个能够识别和计数的应用程序,例如在任何给定的文档/图像行上填写了多少个复选框(如果有人知道的话,它甚至可以是另一种格式)会更好地适应这种类型的应用程序)。最终目标是消除手动数据捕获并加快将总体统计数据提供给应用程序最终用户的过程
我主要使用 C# 编写代码,因此 .net 解决方案会更可取,但如果不是,我会尽我所能。
我的想法是将用户填写的表单重新设计为与此类似的内容。 (请原谅粗糙的 ASCII 艺术 :P)所以填写表格的人只需检查纸上的一个值。
| 1 | 2 | 3 | 4 | 5 |
Product A | [ ] [ ] [ ] [ ] [x] |
Product B | [ ] [ ] [x] [ ] [ ] |
任何想法将不胜感激
谢谢!
最佳答案
1) 您还可以查看免费但功能强大的 Tesseract文字识别引擎。它是用 C++ 编写的,但您可以使用 C# 轻松地与之交互。
2) 如果您想自己动手处理图像,可以考虑使用 EmguCV库,它是 OpenCV 的 .NET 包装器.
最近有一个post在 opencv-tag 上,它试图解决与您的问题非常相似的问题,即检测乐透卡上的标记。
关于c# - 如何以编程方式读取扫描的文档或图像,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8576652/