python-3.x - 如何使用 Google Cloud Vision API 检测笔迹

标签 python-3.x google-cloud-vision handwriting-recognition

TL;DR:如何检测图像中是否存在笔迹？

我正在使用 Google 的 Python Vision API 扫描图像中的文本，结果通常很好。大多数情况下，图像包含打印文本，但有时会包含手写内容。

如文档中所述，有时使用 document_text_detection 而不是标准的 text_detection API 调用可以获得更好的手写文本结果。我自己的测试支持这一点，但也表明标准 text_detection 调用通常最适合 JPEG 图像中的打印文本。

所以我想默认使用标准的 text_detection ，如果有手写，只通过 document_text_detection 运行图像。但是，我找不到一种可靠的方法来使用 Vision API 检测图像中是否存在手写文本。

我尝试了标签检测，但似乎没有用于手写的特定标签。偶尔它会吐出“书法”但不可靠。

有谁知道实现这一目标的方法？

最佳答案

我没用过 Google Cloud Vision API但您可以尝试对象检测模型。我建议使用诸如 LabelImg 之类的工具在用例的文档图像上创建一个带标签的数据集。并训练一个对象检测模型，如 Yolov3 [ paper ] [ code ]。我已经处理过类似的问题它应该可以工作。

关于python-3.x - 如何使用 Google Cloud Vision API 检测笔迹，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/61653288/

上一篇：android - 无法在离线模式下构建。 "No cached version listing for androidx.fragment:fragment:[1.2.0] available for offline mode"

下一篇：html - 字体大小随页面焦点或字段焦点而变化

python - 没有名为 "file1.py"的模块； test1 不是一个包

python - 谷歌云视觉 api 检测到不同数量的标签

machine-learning - 如何评估生成对抗网络(GAN)生成的图片的准确性？

c# - WPF手写.NET 4.5 Windows 8 : Missing IAWinFX. dll等

python-3.x - 根据日期列从宽到长的 Pandas

python - 评估列中唯一值的 True 百分比

oauth2client.client.HttpAccessTokenRefreshError : invalid_grant: Invalid JWT

python - 谷歌云视觉批量处理大量图像使用python

c# - 在 C# 中识别手写数字的神经网络