我从视频中获取数据,因此我无法重新扫描图像,但如有必要,我可以缩放它们。
我只有有限数量的字符 1234567890:
,但我无法控制原始图像或字体的 dpi。
我尝试训练tesseract但没有任何可见效果,测试项目位于https://github.com/ssbarnea/tesseract-sample但当前结果非常糟糕。
捕获的原始图像示例:
OCR 后处理图像示例:
在这种情况下,我该如何改进 OCR 流程?
最佳答案
您可以尝试在图像的边缘添加一些额外的空间,有时它有助于 tesseract。但是,开源 OCR 引擎对源图像 DPI 非常敏感。
关于image-processing - 如何训练tesseract识别低DPI中的小数字?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8261724/