OCR 和文字审查

标签 ocr tesseract

我在我的字母识别项目中使用 Tesseract,目前识别效果非常好。图像处理部分是使用 OpenCv 库完成的。
字母是手写的。但是当我用它来识别字母“O”和数字“0”时出现了一些问题。这些字母在数据区域中用作输入名称的字段。所以名字不能有任何数字。当我们使用数据字段系统作为出生日期时,它只包含数字。所以我愿意对识别系统进行限制,说相应的数据字段只有数字或字母。

我也愿意用可能的词来检查识别的字母,这样我们就可以提高数据的准确性。我愿意使用 openCv 库来完成这项任务。但我不知道有哪些库可以帮助完成这项任务,以及它们的功能是什么。所以请有人帮助我。谢谢你。

问候,
蒂兰卡。

最佳答案

我从来没有用过 Tesseract。然而,in the FAQ it says

如何只识别数字?

TessBaseAPI::SetVariable("tessedit_char_whitelist", "0123456789");

大概您可以使用 FAQ 条目的模式来设置它,以便它只能适本地识别字母或数字。

如果您已经尝试过此方法,能否详细说明为什么它不起作用?

关于OCR 和文字审查,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2396085/

相关文章:

artificial-intelligence - 为 OCR 训练前馈神经网络

ocr - 从扫描的文档/图像中可靠地提取身份字段?

opencv - Unity3D——OCR数字识别

Android Tesseract 进度回调

python - 安装 pytesser

python - 使用 pyteserract 0.1.5 我在使用 print image_to_string(img) 后出现以下错误,它找不到什么文件?

python neurolab 前馈神经网络

android - 如何构建 tess-two(用于 android 的 tesseract 工具的分支)

ios - Tesseract OCR 不会忽略黑名单字符

c++ - 错误 C2146 : syntax error : missing ')' before identifier 'and'