ocr - 如果目标高度明确,OCR 能否瞬间运行? (小词典)

标签 ocr tesseract

我正在寻找一个开源 ocr(也许是 tesseract),它使用字典来匹配单词。例如,我知道这个ocr只会用于搜索某些名称。想象一下,我有一份主宾客名单(书面),我想用 ocr 在不到一秒的时间内扫描该名单,并根据姓名数据库进行检查。

我知道传统的 ocr 可以尝试读取每个字母,然后我可以将结果与 100 个姓名交叉引用,但这需要很长时间。如果 OCR 只专注于这 100 个单词而没有其他任何事情,那么它应该能够在一瞬间完成所有这一切。也就是说,猜测一个单词可能是“Jach”是没有意义的,因为“Jach”不是我数据库中的名字。 ocr 应该能够推断出它是“Jack”,因为这是数据库中的实际名称。

这可能吗?

最佳答案

应该是可以的。可以这样想:您的 OCR 可以直接查找“Jack”,而不是让 OCR 查找“J”,有点像:作为一个单独的符号

因此,当您训练/校准 OCR 时,请使用整个单词的图像进行训练,类似于训练单个符号的方式。

(如果您的 OCR 中无法直接使用此功能,则首先将整个单词的图像映射到唯一的符号,然后将该符号转换为最终的单词字符串)

关于ocr - 如果目标高度明确,OCR 能否瞬间运行? (小词典),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14743519/

相关文章:

windows-phone-7.1 - 超正方 Windows Phone

python - 使用 python 和 Tesseract OCR 从文本中提取特定内容

python - 使用 tesseract-4.0 进行文本提取时如何保留图像中的所有空格?

python - 使用 OpenCV 清理文本图像以进行 OCR 阅读

c++ - 使用 OpenCV 3 的 OCRTesseract 示例

Android Studio 上的 Android Tesseract OCR

从 TIFF 中提取或裁剪图像

ios - 如何设置图像大小以提高 OCR 输出?

java - 使用 tesseract 2.04 和 Java 获取文本位置

c# - csharp中emgucv的全局阈值