ocr - Tesseract OCR用户模式

标签 ocr tesseract

有没有办法让Tesseract只匹配用户指定的单词或模式? manual声称这是可能的,但是我无法在互联网上找到有人记录此实例的单个实例。

以下是许多人寻求帮助的示例,因为它不起作用,而且都没有可靠的解决方案。

stackoverflow.com/questions/33429143/tesseract-user-pattern-is-not-applied

stackoverflow.com/questions/31874393/tesseract-ocr-force-pattern

stackoverflow.com/questions/26856349/provide-pattern-for-tesseract

stackoverflow.com/questions/22432194/tesseract-ocr-only-detect-user-words

stackoverflow.com/questions/17209919/tesseract-user-patterns

groups.google.com/forum/#!topic/tesseract-ocr/S9CIK3jOMWw

groups.google.com/forum/#!topic/tesseract-ocr/5vFqVcJmHnM

那么我们可以得出结论,此功能根本行不通吗?是否有官方声明可以达到此目的?

最佳答案

Tesseract Wiki上的https://github.com/tesseract-ocr/tesseract/wiki/APIExample-user_patterns上有一个示例

该测试示例确实在Tesseract 4.x的oem = 1 / LSTM模式下为我工作。

但是,我无法将其用于其他示例或任何其他模式。

我没有看到官方声明,在撰写本文时,确实确实该功能无效。

关于ocr - Tesseract OCR用户模式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34560697/

相关文章:

c# - 如何以编程方式读取扫描的文档或图像

python - Tesseract OCR 产生空结果

带有国家/地区名称的 Tesseract 数据语言代码

opencv - 使用 Tesseract 进行鸡蛋标记识别的图像预处理

python - pytesseract 提高了图像上模糊数字的 OCR 准确性

google-cloud-platform - Google Vision OCR,将 90、180、270 个文档中的单词坐标旋转到 0 度

ocr - 在 Tesseract 训练中向现有字体添加字符

python - 从图像python中识别数字

opencv - 检测国民身份证并获取详细信息

python - 从图像中删除 OCR 词(OpenCV,Python)