iphone - 超正方 OCR : How to find the read-error-magnitude of each returned character?

标签 iphone image-processing ocr tesseract

我正在 iPhone 应用程序中使用 Tesseract OCR 引擎从账单发票照片中读取特定的数字字段。 使用大量的照片预处理(自适应阈值处理、伪影清理等),结果最终相当准确,但仍有一些情况我需要改进。

如果用户在弱光条件下拍照,并且图片中存在一些噪点或伪影,OCR 引擎会将这些伪影解释为附加数字。在某些后面的情况下,它可以读取例如将“32,15”欧元的数字金额转换为“5432,15”欧元,这对于最终用户对产品的信心完全没有好处。

我假设,如果存在与每个读取的字符相关的内部 OCR 引擎读取错误,则我之前示例中的“54”数字会更高,因为它们是通过小噪声像素识别的,并且如果我有权访问此读取错误值,我将能够轻松丢弃错误的数字。

您知道有什么方法可以获取从 tesseract OCR 引擎返回的每个单独字符的读取误差大小(或任何“准确度因子”值)吗?

最佳答案

在 Tesseract 术语中称为“置信度”值。在 tesseract-ocr Group 中搜索该词条出现了许多提到 TesseractExtractResult 方法的答案。

hOCR output也包含这个值。

关于iphone - 超正方 OCR : How to find the read-error-magnitude of each returned character?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7060535/

相关文章:

c# - 使用MinHash查找2张图像之间的相似性

image-processing - 为 OCR 准备复杂图像

OCR:加权 Levenshtein 距离

opencv - 是否有可能使两个灰度图像在统计上相等?

java - 使用java和opencv对灰度图像进行图像融合给出了奇怪的结果

ocr - combine_tessdata : command not found

iphone - 灰色 UISearchBar 以编程方式匹配范围栏

iPhone SDK - HTML 源代码中的 stringWithContentsOfUrl ASCII 字符

iphone - Xcode 上奇怪的编译时错误

iphone - 自定义 UIButton