我一直在尝试使用 Python 实现一个 OCR 程序,该程序读取具有特定格式 XXX-XXX 的数字。我使用了 Google 的 Cloud Vision API 文本识别,但结果并不可靠。在 30 张高对比度 1280 x 1024 bmp 图像中,只有少数图像输出正确,或者至少在结果中包含了正确的输出。该程序往往会省略一些数字、以非英语语言输出或潜入一些特殊字符。
目标是至少连续输出正确的数字,如果结果中散布着其他垃圾也没关系。有没有办法帮助程序更好地识别数字,例如将结果限制为特定格式,或仅限于数字?
最佳答案
我无法告诉你为什么会这样,也许这与语言的阅读方式有关,o vs 0,l vs 1,等等。但是每当我使用 OCR 并且我专门寻找数字时,我有读取以将检测语言设置为“韩语”。它对我来说效果非常好,并且极大地影响了准确性。
关于python - Google Cloud Vision - 数字和数字 OCR,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39540741/