image-processing - 如何训练tesseract识别低DPI中的小数字?

标签 image-processing ocr tesseract

我从视频中获取数据,因此我无法重新扫描图像,但如有必要,我可以缩放它们。

我只有有限数量的字符 1234567890: ,但我无法控制原始图像或字体的 dpi。

我尝试训练tesseract但没有任何可见效果,测试项目位于https://github.com/ssbarnea/tesseract-sample但当前结果非常糟糕。

捕获的原始图像示例:

enter image description here

OCR 后处理图像示例:

enter image description here

在这种情况下,我该如何改进 OCR 流程?

最佳答案

您可以尝试在图像的边缘添加一些额外的空间,有时它有助于 tesseract。但是,开源 OCR 引擎对源图像 DPI 非常敏感。

关于image-processing - 如何训练tesseract识别低DPI中的小数字?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8261724/

相关文章:

java - OpenCV Mat 处理时间

python - 如何使用 python opencv 去除这些图片中的阴影?

python - 在 plone 上上传文件并通过 python 脚本下载它们?

python - 高效的OCR微调

python - 为什么 pytesseract 无法识别这个简单图像中的数字?

linux - 如何获取或生成 Tesseract box 文件中所需的 Unicode?

java - 如何从PDF图像中提取文本

python - 设置Python OpenCV warpPerspective的背景

python - 与python匹配的scipy方法

iphone - 使用Iphone相机识别特定位置的文本