OCR 和文字审查

标签 ocr tesseract

我在我的字母识别项目中使用 Tesseract，目前识别效果非常好。图像处理部分是使用 OpenCv 库完成的。
字母是手写的。但是当我用它来识别字母“O”和数字“0”时出现了一些问题。这些字母在数据区域中用作输入名称的字段。所以名字不能有任何数字。当我们使用数据字段系统作为出生日期时，它只包含数字。所以我愿意对识别系统进行限制，说相应的数据字段只有数字或字母。

我也愿意用可能的词来检查识别的字母，这样我们就可以提高数据的准确性。我愿意使用 openCv 库来完成这项任务。但我不知道有哪些库可以帮助完成这项任务，以及它们的功能是什么。所以请有人帮助我。谢谢你。

问候，
蒂兰卡。

最佳答案

我从来没有用过 Tesseract。然而，in the FAQ it says

如何只识别数字？

TessBaseAPI::SetVariable("tessedit_char_whitelist", "0123456789");

大概您可以使用 FAQ 条目的模式来设置它，以便它只能适本地识别字母或数字。

如果您已经尝试过此方法，能否详细说明为什么它不起作用？

关于OCR 和文字审查，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/2396085/

上一篇：visual-studio-2008 - Visual Studio 2008 : Don't deploy SQL Server Compact 3. 5 调试时

下一篇：ruby-on-rails - 在 memcached 中存储 ActiveRecord 对象的最佳方法是什么？

ocr - 从扫描的文档/图像中可靠地提取身份字段？

opencv - Unity3D——OCR数字识别

Android Tesseract 进度回调

python - 安装 pytesser

python - 使用 pyteserract 0.1.5 我在使用 print image_to_string(img) 后出现以下错误，它找不到什么文件？

python neurolab 前馈神经网络

android - 如何构建 tess-two(用于 android 的 tesseract 工具的分支)

ios - Tesseract OCR 不会忽略黑名单字符

c++ - 错误 C2146 : syntax error : missing ')' before identifier 'and'