python - 图像上框架文本的坐标

标签 python image image-processing python-imaging-library

我想获取图像上框架文本的坐标。这些段落有细黑边框。图像的其余部分包含常用的段落和草图。

这是一个示例:enter image description here

你知道我应该在Python中使用什么样的算法和图像库来实现这个目的吗?谢谢。

最佳答案

检测框架文本的一些想法,主要归结为搜索大尺寸的框/矩形:

  • 使用 OpenCV 查找轮廓,使用 cv2.approxPolyDP() 分析形状多边形近似算法(也称为 Ramer–Douglas–Peucker algorithm )。您还可以检查边界框的长宽比,以确保形状是矩形,并检查页面宽度,因为这在您的情况下似乎是已知的度量标准。 PyImageSearch 做了这篇很棒的文章:

  • related question ,还有一个建议可以查看Hough Lines要检测水平线,请转动并以相同的方式检测垂直线。不能 100% 确定这种方法的可靠性。


找到框框后,下一步就是检查框内是否有任何文本。一般来说,检测文本是一个更广泛的问题,有很多方法可以实现,以下是一些示例:


其他引用资料:

关于python - 图像上框架文本的坐标,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65355295/

相关文章:

python - 列表中元素的对称二分匹配

java - ImageIO 无法读取图像输入文件

image - 添加并保存圆形蒙版框图像

image-processing - pHash 对某些图像产生奇怪的结果

algorithm - 如何计算图像适合其容器的最佳比例?

python - 在 Python 中使用字典替换子字符串

python - scipy interpolate 给出无界值

python - Pipfile 和 Pipfile.lock 如何使用?

python - 计算两个图像之间的相似度百分比

javascript - 如何在没有 jquery UI 的情况下在 div 中单击时使图像可调整大小