iphone - 超正方 OCR : How to find the read-error-magnitude of each returned character?

标签 iphone image-processing ocr tesseract

我正在 iPhone 应用程序中使用 Tesseract OCR 引擎从账单发票照片中读取特定的数字字段。使用大量的照片预处理(自适应阈值处理、伪影清理等)，结果最终相当准确，但仍有一些情况我需要改进。

如果用户在弱光条件下拍照，并且图片中存在一些噪点或伪影，OCR 引擎会将这些伪影解释为附加数字。在某些后面的情况下，它可以读取例如将“32,15”欧元的数字金额转换为“5432,15”欧元，这对于最终用户对产品的信心完全没有好处。

我假设，如果存在与每个读取的字符相关的内部 OCR 引擎读取错误，则我之前示例中的“54”数字会更高，因为它们是通过小噪声像素识别的，并且如果我有权访问此读取错误值，我将能够轻松丢弃错误的数字。

您知道有什么方法可以获取从 tesseract OCR 引擎返回的每个单独字符的读取误差大小(或任何“准确度因子”值)吗？

最佳答案

在 Tesseract 术语中称为“置信度”值。在 tesseract-ocr Group 中搜索该词条出现了许多提到 TesseractExtractResult 方法的答案。

hOCR output也包含这个值。

关于iphone - 超正方 OCR : How to find the read-error-magnitude of each returned character?，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/7060535/

上一篇：iphone - 如何为 opengles 2.0 实现 glOrtho？有或没有 glOrtho 规范中的 tx、ty、tz 值？

下一篇：iphone - 是否有在 iPhone 和 iPad 应用程序之间共享开发代码的最佳实践

相关文章：

c# - 使用MinHash查找2张图像之间的相似性

image-processing - 为 OCR 准备复杂图像

OCR:加权 Levenshtein 距离

opencv - 是否有可能使两个灰度图像在统计上相等？

java - 使用java和opencv对灰度图像进行图像融合给出了奇怪的结果

ocr - combine_tessdata : command not found

iphone - 灰色 UISearchBar 以编程方式匹配范围栏

iPhone SDK - HTML 源代码中的 stringWithContentsOfUrl ASCII 字符

iphone - Xcode 上奇怪的编译时错误

iphone - 自定义 UIButton