python - Google Cloud Vision - 数字和数字 OCR

标签 python ocr google-cloud-platform google-cloud-vision text-recognition

我一直在尝试使用 Python 实现一个 OCR 程序,该程序读取具有特定格式 XXX-XXX 的数字。我使用了 Google 的 Cloud Vision API 文本识别,但结果并不可靠。在 30 张高对比度 1280 x 1024 bmp 图像中,只有少数图像输出正确,或者至少在结果中包含了正确的输出。该程序往往会省略一些数字、以非英语语言输出或潜入一些特殊字符。

目标是至少连续输出正确的数字,如果结果中散布着其他垃圾也没关系。有没有办法帮助程序更好地识别数字,例如将结果限制为特定格式,或仅限于数字?

最佳答案

我无法告诉你为什么会这样,也许这与语言的阅读方式有关,o vs 0,l vs 1,等等。但是每当我使用 OCR 并且我专门寻找数字时,我有读取以将检测语言设置为“韩语”。它对我来说效果非常好,并且极大地影响了准确性。

关于python - Google Cloud Vision - 数字和数字 OCR,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39540741/

相关文章:

asp.net-core - Google Cloud Platform 上的 NET Core 2.1 无法验证 HTTPS 连接 TLS 握手失败,数据包格式意外

google-cloud-platform - 您可以调用特定版本的 Google Cloud 函数吗?

python - 如何在 Python 中逐行打印嵌套列表中的项目?

python - 在 Django 1.6 中结合 DetailView 和 CreateView

c# - Emgu - 如何从屏幕截图中提取可能代表图标或控件的图像?

c++ - 为 OCR OpenCV 做准备

ubuntu - 谷歌云平台 : How to make VM continue calculations after disconnecting from the Internet?

python - 如何使 json-schema 允许一个字段而不是另一个字段?

python - 我如何摆脱像 ' 这样出现而不是撇号的字符?

python - 我可以在 python 中以百分比精度执行 "string contains X"吗?