image-processing - 如何训练tesseract识别低DPI中的小数字？

标签 image-processing ocr tesseract

我从视频中获取数据，因此我无法重新扫描图像，但如有必要，我可以缩放它们。

我只有有限数量的字符 1234567890: ，但我无法控制原始图像或字体的 dpi。

我尝试训练tesseract但没有任何可见效果，测试项目位于https://github.com/ssbarnea/tesseract-sample但当前结果非常糟糕。

捕获的原始图像示例:

enter image description here

OCR 后处理图像示例:

在这种情况下，我该如何改进 OCR 流程？

最佳答案

您可以尝试在图像的边缘添加一些额外的空间，有时它有助于 tesseract。但是，开源 OCR 引擎对源图像 DPI 非常敏感。

关于image-processing - 如何训练tesseract识别低DPI中的小数字？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/8261724/

上一篇：erlang - 如何让 webmachine 与 websockets 一起玩？

下一篇：jasper-reports 动态子报表生成

相关文章：

java - OpenCV Mat 处理时间

python - 如何使用 python opencv 去除这些图片中的阴影？

python - 在 plone 上上传文件并通过 python 脚本下载它们？

python - 高效的OCR微调

python - 为什么 pytesseract 无法识别这个简单图像中的数字？

linux - 如何获取或生成 Tesseract box 文件中所需的 Unicode？

java - 如何从PDF图像中提取文本

python - 设置Python OpenCV warpPerspective的背景

python - 与python匹配的scipy方法

iphone - 使用Iphone相机识别特定位置的文本