python - 复杂背景下的OCR时间戳提取

这是从 CCTV 视频中截取的图像，我想从快照中提取时间戳。 OpenCV/Tesseract/python 是这项工作的工具:

这里的困难是复杂的背景，所以即使我用中值文件过滤器(opencv)对图片进行二值化，ocr结果仍然很糟糕。当然，我可以应用特定的自定义阈值，但在这里我遇到了两个问题:

如何处理白色和黑色的字符？

有没有办法(某些方法)为这些类型的图片提供更一般的阈值？

也许我在这里处理预处理的想法是不正确的。在发送到 Tesseract 之前对这种图像进行预处理似乎不是一件容易的事。任何提示和想法都值得感谢。

最佳答案

做两次阈值处理，一次通常用于 254 以上的白色像素，一次用于倒置图片:img = cv2.bitwise_not(img) ，然后合并两个结果

有一个inRange OpenCV 中的函数，您可以在其中设置最小/最大 HSV 值。使用 HSV 值的输入参数创建一个函数，将这些值记录在列表中，然后使用 for 进行迭代。循环屏蔽+合并

关于python - 复杂背景下的OCR时间戳提取，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/64709869/

相关文章：

python - 为什么会收到此SyntaxError？