TL;DR:如何检测图像中是否存在笔迹?
我正在使用 Google 的 Python Vision API 扫描图像中的文本,结果通常很好。大多数情况下,图像包含打印文本,但有时会包含手写内容。
如文档中所述,有时使用 document_text_detection 而不是标准的 text_detection API 调用可以获得更好的手写文本结果。我自己的测试支持这一点,但也表明标准 text_detection 调用通常最适合 JPEG 图像中的打印文本。
所以我想默认使用标准的 text_detection ,如果有手写,只通过 document_text_detection 运行图像。但是,我找不到一种可靠的方法来使用 Vision API 检测图像中是否存在手写文本。
我尝试了标签检测,但似乎没有用于手写的特定标签。偶尔它会吐出“书法”但不可靠。
有谁知道实现这一目标的方法?
最佳答案
我没用过 Google Cloud Vision API
但您可以尝试对象检测模型。我建议使用诸如 LabelImg 之类的工具在用例的文档图像上创建一个带标签的数据集。并训练一个对象检测模型,如 Yolov3
[ paper ] [ code ]。我已经处理过类似的问题它应该可以工作。
关于python-3.x - 如何使用 Google Cloud Vision API 检测笔迹,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61653288/