c++ - Tesseract 或任何其他 OCR 库

标签 c++ ocr image-recognition tesseract

我正在寻找有关如何在 C++ 中使用(和训练?)Tesseract 的解释/API 文档/示例,在 google Tesseract 页面上没有任何有用的信息,但尚未在网上找到一些东西。

任何有用的资源和经验都将非常受欢迎,因为我不知道如何开始。

附言:

  1. 我愿意听取关于其他方面的建议 图书馆。
  2. 免费

最佳答案

我对 Tesseract 有一些经验... 一个简单的“训练 tesseract”谷歌显示了这个页面: http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract 您必须在其中选择要训练的 tesseract 版本.. 虽然 3 是最新版本,但它是全新的,因此人们仍在解决任何问题——我仍在使用 2.4 版。无论如何,您会看到针对特定“语言”(或应该称为“字体”或“字符集”的东西)训练 tesseract 大约有 9 个步骤。您也可以只使用现有的“eng”语言——但这取决于您的应用程序。例如,在我的应用程序中,我必须进行文档分析并获取特定区域并希望对 13 个字符的数字字符串进行 OCR - 我需要高精度 - 我不希望它读作 '5' 作为 ' S' 和 '0' 作为 'O' 等,因此为我的特定字体集创建仅包含字符 0..9 的特定“语言”是合乎逻辑的,而您可能不在乎是否会产生额外的“噪音”

关于c++ - Tesseract 或任何其他 OCR 库,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4314060/

相关文章:

c++ - 我可以从智能卡中的 key 容器中获取公钥/私钥对吗?

python - 破解一个闭源程序来帮助我使用 python/screenshot/OCR 对现实生活中的对象进行排序

java - 无法使用 TesseractOCRConfig Apache Tika 提取扫描的 pdf

c++ - gdb SIGABRT 而不是 SIGSEGV

c++ - boost 函数和 lambda 来包装一个函数

android - (MOBILE)图像光学识别统计元素数量

c++ - 汉明距离目标检测

java - DrawMatching between two images - 图像识别

c++ - 在 C++ 中以二进制形式编写一个结构

python - 对图像中的单个字符进行校正