我有 .pdf
文件已转换为此项目的 .jpg
图像。我的目标是识别您通常会在 .pdf
表单中找到的空白(例如 ____________),这些空白指示用户签署或填写某种信息的空间。我一直在使用 cv2.Canny()
和 cv2.HoughlinesP()
函数进行边缘检测。
这工作得相当好,但有相当多的误报似乎不知从何而来。当我查看“edges”文件时,它会在其他词周围显示出一堆噪音。我不确定这种噪音是从哪里来的。
我应该继续调整参数,还是有更好的方法来找到这些空白的位置?
最佳答案
假设您正试图在 .pdf
表单上查找水平线,这里有一个简单的方法:
- 将图像转换为灰度和自适应阈值图像
- 构造特殊的核来只检测水平线
- 执行形态转换
- 找到轮廓并绘制到图像上
使用这个示例图片
转换为灰度和自适应阈值得到二值图像
gray = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]
然后我们使用cv2.getStructuringElement()
创建一个内核并执行形态转换以隔离水平线
horizontal_kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (15,1))
detected_lines = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, horizontal_kernel, iterations=2)
从这里我们可以使用cv2.HoughLinesP()
来检测线条,但是由于我们已经对图像进行了预处理并隔离了水平线,我们可以只找到轮廓并绘制结果
cnts = cv2.findContours(detected_lines, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = cnts[0] if len(cnts) == 2 else cnts[1]
for c in cnts:
cv2.drawContours(image, [c], -1, (36,255,12), 3)
完整代码
import cv2
image = cv2.imread('2.png')
gray = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]
horizontal_kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (15,1))
detected_lines = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, horizontal_kernel, iterations=2)
cnts = cv2.findContours(detected_lines, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = cnts[0] if len(cnts) == 2 else cnts[1]
for c in cnts:
cv2.drawContours(image, [c], -1, (36,255,12), 3)
cv2.imshow('thresh', thresh)
cv2.imshow('detected_lines', detected_lines)
cv2.imshow('image', image)
cv2.waitKey()
关于python - 使用 OpenCV 检测 .pdf 格式图像中的水平空白行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57260893/