python - 使用 OpenCV 检测 .pdf 格式图像中的水平空白行

我有 .pdf 文件已转换为此项目的 .jpg 图像。我的目标是识别您通常会在 .pdf 表单中找到的空白(例如 ____________)，这些空白指示用户签署或填写某种信息的空间。我一直在使用 cv2.Canny() 和 cv2.HoughlinesP() 函数进行边缘检测。

这工作得相当好，但有相当多的误报似乎不知从何而来。当我查看“edges”文件时，它会在其他词周围显示出一堆噪音。我不确定这种噪音是从哪里来的。

我应该继续调整参数，还是有更好的方法来找到这些空白的位置？

最佳答案

假设您正试图在 .pdf 表单上查找水平线，这里有一个简单的方法:

将图像转换为灰度和自适应阈值图像
构造特殊的核来只检测水平线
执行形态转换
找到轮廓并绘制到图像上

使用这个示例图片

转换为灰度和自适应阈值得到二值图像

gray = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]

然后我们使用cv2.getStructuringElement() 创建一个内核并执行形态转换以隔离水平线

horizontal_kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (15,1))
detected_lines = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, horizontal_kernel, iterations=2)

从这里我们可以使用cv2.HoughLinesP()来检测线条，但是由于我们已经对图像进行了预处理并隔离了水平线，我们可以只找到轮廓并绘制结果

cnts = cv2.findContours(detected_lines, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = cnts[0] if len(cnts) == 2 else cnts[1]

for c in cnts:
    cv2.drawContours(image, [c], -1, (36,255,12), 3)

完整代码

import cv2

image = cv2.imread('2.png')
gray = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]

horizontal_kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (15,1))
detected_lines = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, horizontal_kernel, iterations=2)

cnts = cv2.findContours(detected_lines, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = cnts[0] if len(cnts) == 2 else cnts[1]

for c in cnts:
    cv2.drawContours(image, [c], -1, (36,255,12), 3)

cv2.imshow('thresh', thresh)
cv2.imshow('detected_lines', detected_lines)
cv2.imshow('image', image)
cv2.waitKey()

关于python - 使用 OpenCV 检测 .pdf 格式图像中的水平空白行，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57260893/

python - 使用 OpenCV 检测 .pdf 格式图像中的水平空白行

上一篇：python - Numpy:有效地将所有满足条件的像素设置为黑色

下一篇：python - 如何检测图像中的游戏板