python-3.x - 如何使用 Google Cloud Vision API 检测笔迹

标签 python-3.x google-cloud-vision handwriting-recognition

TL;DR:如何检测图像中是否存在笔迹?

我正在使用 Google 的 Python Vision API 扫描图像中的文本,结果通常很好。大多数情况下,图像包含打印文本,但有时会包含手写内容。

如文档中所述,有时使用 document_text_detection 而不是标准的 text_detection API 调用可以获得更好的手写文本结果。我自己的测试支持这一点,但也表明标准 text_detection 调用通常最适合 JPEG 图像中的打印文本。

所以我想默认使用标准的 text_detection ,如果有手写,只通过 document_text_detection 运行图像。但是,我找不到一种可靠的方法来使用 Vision API 检测图像中是否存在手写文本。

我尝试了标签检测,但似乎没有用于手写的特定标签。偶尔它会吐出“书法”但不可靠。

有谁知道实现这一目标的方法?

最佳答案

我没用过 Google Cloud Vision API但您可以尝试对象检测模型。我建议使用诸如 LabelImg 之类的工具在用例的文档图像上创建一个带标签的数据集。并训练一个对象检测模型,如 Yolov3 [ paper ] [ code ]。我已经处理过类似的问题它应该可以工作。

关于python-3.x - 如何使用 Google Cloud Vision API 检测笔迹,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61653288/

相关文章:

python-3.x - 错误 : cannot import name 'PDFDocument' from 'pdfminer.pdfparser'

python - 没有名为 "file1.py"的模块; test1 不是一个包

python - 谷歌云视觉 api 检测到不同数量的标签

machine-learning - 如何评估生成对抗网络(GAN)生成的图片的准确性?

c# - WPF手写.NET 4.5 Windows 8 : Missing IAWinFX. dll等

python-3.x - 根据日期列从宽到长的 Pandas

python - 评估列中唯一值的 True 百分比

oauth2client.client.HttpAccessTokenRefreshError : invalid_grant: Invalid JWT

python - 谷歌云视觉批量处理大量图像使用python

c# - 在 C# 中识别手写数字的神经网络