python - opencv 特征与空公式模板匹配

标签 python opencv computer-vision pattern-matching feature-detection

我一直在尝试将扫描的公式与其空模板进行匹配。目标是旋转和缩放它以匹配模板。

Source fomular, to be rescaled and rotated Template
源(左),模板(右)
Matches Homography warp result
匹配(左),单应性扭曲(右)
模板不包含任何非常具体的 Logo 、固定十字或矩形框架,这些可以方便地帮助我进行特征或图案匹配。更糟糕的是,扫描的公式可能会被歪曲、更改,并且包含手写签名和印章。

在测试 ORB 特征匹配失败后,我的方法是专注于公式的形状(行和列)。

我在这里提供的图片是通过在具有一定最小尺寸的分段检测(LSD)之后重构线条而获得的。源代码和模板剩下的大部分内容就是文档布局本身。

在下面的脚本(应该与图片一起开箱即用)中,我尝试进行 ORB 特征匹配,但未能使其工作,因为它集中在边缘而不是文档布局上。

import cv2  # using opencv-python v3.4
import numpy as np
from imutils import resize


# alining image using ORB descriptors, then homography warp
def align_images(im1, im2,MAX_MATCHES=5000,GOOD_MATCH_PERCENT = 0.15):

    # Detect ORB features and compute descriptors.
    orb = cv2.ORB_create(MAX_MATCHES)
    keypoints1, descriptors1 = orb.detectAndCompute(im1, None)
    keypoints2, descriptors2 = orb.detectAndCompute(im2, None)

    # Match features.
    matcher = cv2.DescriptorMatcher_create(cv2.DESCRIPTOR_MATCHER_BRUTEFORCE_HAMMING)
    matches = matcher.match(descriptors1, descriptors2, None)

    # Sort matches by score
    matches.sort(key=lambda x: x.distance, reverse=False)

    # Remove not so good matches
    numGoodMatches = int(len(matches) * GOOD_MATCH_PERCENT)
    matches = matches[:numGoodMatches]

    # Draw top matches
    imMatches = cv2.drawMatches(im1, keypoints1, im2, keypoints2, matches, None)

    # Extract location of good matches
    points1 = np.zeros((len(matches), 2), dtype=np.float32)
    points2 = np.zeros((len(matches), 2), dtype=np.float32)

    for i, match in enumerate(matches):
        points1[i, :] = keypoints1[match.queryIdx].pt
        points2[i, :] = keypoints2[match.trainIdx].pt

    # Find homography
    h, mask = cv2.findHomography(points1, points2, cv2.RANSAC)

    # Use homography
    if len(im2.shape) == 2:
        height, width = im2.shape
    else:
        height, width, channels = im2.shape
    im1Reg = cv2.warpPerspective(im1, h, (width, height))

    return im1Reg, h, imMatches

template_fn = './stack/template.jpg'
image_fn = './stack/image.jpg'

im = cv2.imread(image_fn, cv2.IMREAD_GRAYSCALE)
template = cv2.imread(template_fn, cv2.IMREAD_GRAYSCALE)

# aligh images
imReg, h, matches = align_images(template,im)

# display output
cv2.imshow('im',im)
cv2.imshow('template',template)
cv2.imshow('matches',matches)
cv2.imshow('result',imReg)
cv2.waitKey(0)
cv2.destroyAllWindows()

有什么方法可以让模式匹配算法对左侧图像(源)起作用? (另一个想法是只留下线条交叉点)

或者,我一直在尝试对循环进行缩放和旋转不变模式匹配,同时保持最大相关性,但它太消耗资源而且不太可靠。

因此,我正在使用 opencv 寻找正确方向的提示。

最佳答案

解决方案

问题在于将图像简化为真正重要的内容:布局。
此外,ORB 也不合适,因为它不像 SIFT 和 AKAZE 那样稳健(旋转和尺寸不变)。

我按照以下步骤进行:

  • 将图像转换为黑白
  • 使用线段检测并过滤宽度小于 1/60 的线条
  • 从片段重建图像(线宽没有太大影响)
  • (可选:调整图片大小以加快其余速度)
  • 对线重建应用高斯变换,宽度的 1/25
  • 使用 SIFT(专利)或 AKAZE(免费)算法检测和匹配特征
  • 找到单应性并扭曲源图片以匹配模板

Matches AKAZE
AKAZE 的比赛

Matches SIFT
SIFT 匹配

我注意到:

  • 模板的布局必须匹配,否则它只会坚持它识别的内容
  • 分辨率越高,线检测效果越好,然后由于应用了高斯分布,因此可以缩小尺寸
  • SIFT 产生更多特征,并且似乎比 AKAZE 更可靠

关于python - opencv 特征与空公式模板匹配,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54776613/

相关文章:

python - VS code python 自动补全非常慢

c++ - OpenCV MWE 中的段错误

opencv - 连接 Kinect for Windows 与 PCL 和 OpenCV

matlab - 如何使用 MATLAB 查找图像中红色区域的位置?

python - 如何在 Django Rest Framework 中对外部 API 进行分页

python - 构建正则表达式以匹配 Python 中多个匹配项中的第一个匹配项

python - 使用 ffmpeg 从 python openCV 流式传输图像

python - 如何保存分辨率大于1080p的图片?

opencv - 如何从二进制掩码生成 trimap?

opencv - 变换的基本矩阵