c++ - Tesseract OCR 的置信度值

标签 c++ ocr tesseract

<分区>

我有一些关于 Tesseract OCR 置信值的问题,可以通过调用 C++ API 中的 AllWordConfidences() 函数获得。

  1. 什么是置信度值(由 tesseract API 返回)以及tesseract 如何计算该值?(例如基于哪些因素)?

  2. 我是否可以更改 tesseract 的精度级别?

谁能帮我解决这些问题?谢谢。

最佳答案

我在其他 OCR 软件(特别是 ANPR 软件)中使用过类似的指标。如果我没记错的话,总体上有两个置信度因素;一个是 0->100% 置信因子,另一个是 0->X 值,用作各种级联置信因子的聚合。
这个值是任意的,所以我建议使用 0->100% 值。另请注意,每个字符都应有一个置信度。

这些指标是通过评估轮廓线/边缘的清晰程度、在字符中检测到的形状与预期形状的接近程度以及选择一个字符与另一个字符的决策有多接近来计算的。 IE OCR 在“p”和“b”之间的选择比“Q”和“O”更容易。

“改进”这些指标的唯一方法是训练检测器!因此,准备好拥有大量有效数据。您还需要耐心使用 Tesseract 训练工具 - 我发现它们有 75% 是噩梦。

祝你好运!

关于c++ - Tesseract OCR 的置信度值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44323053/

相关文章:

ios - 如何将 hin.cube.lm 放入 xcode

c++ - 构建同一 C/C++ 应用程序的变体的最佳方法是什么

c++ - 首先从目录中读取较新的文件 - C++

c# - OCR线检测

python - TensorFlow:训练时参数不更新

iphone - iPhone应用程序中的tesseract OCR

node.js - 无法使用node-tesseract从表单中读取手写文本

bash - Tesseract 训练 - 微调角色

c++ - "natural_alignment_of"类型特征?

c++ - 动态分配缓冲区(字符字符串)大小=i;使用malloc