c# - 用于从 cedula/passport C# 中提取文本的 OCR

标签 c# asp.net-mvc image-processing ocr

我正在寻找 Tesseract 或 Google 的 Vision API 类型的 OCR,它可以帮助提取护照/身份证中的文本信息图像,(可能是从手机捕获的或可能是扫描的。因此帧大小可能会略有不同)。我浏览了几篇文章,发现 Tesseract作为首选解决方案。

我还使用 Vision API 测试了我的测试数据, 并得到 99% 准确和令人满意的结果。但我有以下问题/要求:

问题:

  • Tesseract 是我在浏览过的大多数帖子中找到的建议解决方案,但它给出了非常糟糕的结果,因为框架可能会有所不同。我无法训练数据,但我可以使用任何可用的付费库来帮助我处理我的场景。
  • Vision API 提供准确的结果,但我的要求是使用基于云的解决方案。
  • 很少有提供此功能的提供商(例如LeadToolIdScan 等),但他们会先使用扫描仪扫描护照。因此,他们的 SDK 适用于他们的扫描仪设备。

总结:是否有任何可用的(付费或开源) c# 库可用,它将护照/cedula 图像作为输入,并返回准确的文字?任何建议/帮助将不胜感激。

最佳答案

名为 MicroBlink 的公司创建了 BlinkID SDK 来扫描护照、身份证。它不是免费用于商业用途,但可以免费用于开发。链接到 SDK 的站点 HERE . Tesseract OCR 工具可能会给你错误的结果,因为你可能在 OCR 扫描之前没有对图像进行任何处理,如果你想要一个正确的结果,这是强制性的,特别是对于护照和身份证等的图像。对于图像处理,您可以使用 OpenCV(免费),但您可能需要花时间学习计算机视觉和图像处理(这实际上是非常有益的)。

关于c# - 用于从 cedula/passport C# 中提取文本的 OCR,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38989042/

相关文章:

asp.net-mvc - 使用 WIF 和 jquery ajax 请求时 ASP.NET MVC 3 中的 session Cookie 过期处理

python - matplotlib 为图像添加蓝色阴影

android - 在Android框架中编辑文本

ios - 图像中的 UIBezierPath

C#:DataTable逐行转换

c# - 多线程异常和处置。为什么 Dispose 没有调用?

c# - 如何为具有身份列的 NHibernate 实体实现 GetHashCode?

c# - 找不到资源 asp.net mvc

c# - ASP.NET MVC Html Helper 用法

c# - 从架构角度看Apache/Tomcat与IIS7的共性和差异