python - 使用 OpenCV 检测 .pdf 格式图像中的水平空白行

标签 python image opencv image-processing computer-vision

我有 .pdf 文件已转换为此项目的 .jpg 图像。我的目标是识别您通常会在 .pdf 表单中找到的空白(例如 ____________),这些空白指示用户签署或填写某种信息的空间。我一直在使用 cv2.Canny()cv2.HoughlinesP() 函数进行边缘检测。

这工作得相当好,但有相当多的误报似乎不知从何而来。当我查看“edges”文件时,它会在其他词周围显示出一堆噪音。我不确定这种噪音是从哪里来的。

我应该继续调整参数,还是有更好的方法来找到这些空白的位置?

最佳答案

假设您正试图在 .pdf 表单上查找水平线,这里有一个简单的方法:

  • 将图像转换为灰度和自适应阈值图像
  • 构造特殊的核来只检测水平线
  • 执行形态转换
  • 找到轮廓并绘制到图像上

使用这个示例图片

转换为灰度和自适应阈值得到二值图像

gray = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]

然后我们使用cv2.getStructuringElement() 创建一个内核并执行形态转换以隔离水平线

horizontal_kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (15,1))
detected_lines = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, horizontal_kernel, iterations=2)

从这里我们可以使用cv2.HoughLinesP()来检测线条,但是由于我们已经对图像进行了预处理并隔离了水平线,我们可以只找到轮廓并绘制结果

cnts = cv2.findContours(detected_lines, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = cnts[0] if len(cnts) == 2 else cnts[1]

for c in cnts:
    cv2.drawContours(image, [c], -1, (36,255,12), 3)

完整代码

import cv2

image = cv2.imread('2.png')
gray = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]

horizontal_kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (15,1))
detected_lines = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, horizontal_kernel, iterations=2)

cnts = cv2.findContours(detected_lines, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = cnts[0] if len(cnts) == 2 else cnts[1]

for c in cnts:
    cv2.drawContours(image, [c], -1, (36,255,12), 3)

cv2.imshow('thresh', thresh)
cv2.imshow('detected_lines', detected_lines)
cv2.imshow('image', image)
cv2.waitKey()

关于python - 使用 OpenCV 检测 .pdf 格式图像中的水平空白行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57260893/

相关文章:

html - 如何让我的图像在标题中响应?

python-3.x - 使用 Cmake 编译 OpenCV 以将其集成到 Conda 环境中

c++ - OpenCV:为什么 *p_img1=*p_img2 不正确

python - 使用 app.add_url_rule 时需要命名 url 吗?

#ifdef DEBUG 的 Python 等效项

python - 自定义排序列表,了解一些项目的顺序

python - Python '.join' 是否保持输入数据顺序?

javascript - 在 Javascript 变量中存储图像?

android - API - 适用于 iOS 和 Android 的图像尺寸(不同屏幕尺寸)- 优化

c++ - 来自 Mat 图像的 OpenCV 子图像