python - 从图像中去除噪声线

我的图像带有一些随机线条，如下所示:
enter image description here
我想对它们进行一些预处理，以消除不需要的噪音(扭曲文字的线条)，以便我可以将它们与 OCR (Tesseract) 一起使用。
我想到的想法是用膨胀来去除噪声，然后在第二步用腐 eclipse 来修复书写缺失的部分。
为此，我使用了这段代码:

import cv2
import numpy as np

img = cv2.imread('linee.png', cv2.IMREAD_GRAYSCALE)
kernel = np.ones((5, 5), np.uint8)
img = cv2.dilate(img, kernel, iterations=1)
img = cv2.erode(img, kernel, iterations=1)
cv2.imwrite('delatedtest.png', img)

不幸的是，膨胀效果不佳，噪声线仍然存在。

enter image description here
我尝试更改内核形状，但情况变得更糟:文字被部分或完全删除。
我还找到了一个 answer说可以通过

删除行

turning all black pixels with two or less adjacent black pixels to white.

这对我来说有点复杂，因为我是计算机视觉和 opencv 的初学者。
任何帮助将不胜感激，谢谢。

最佳答案

检测像这样的线条是 path opening被发明的。 DIPlib有一个实现(披露:我在那里实现了它)。作为替代方案，您可以尝试使用 the implementation by the authors我上面链接的论文。该实现没有 the "constrained" mode我在下面使用。

这是一个关于如何使用它的快速演示:

import diplib as dip
import matplotlib.pyplot as pp

img = 1 - pp.imread('/home/cris/tmp/DWRTF.png')
lines = dip.PathOpening(img, length=300, mode={'constrained'})

这里我们首先反转图像，因为这样可以让后面的事情变得更容易。如果不反转，请改用路径闭合。 行图像:

接下来我们减去线条。一个小区域开口去除了被路径开口过滤掉的线条的几个孤立像素:

text = img - lines
text = dip.AreaOpening(text, filterSize=5)

但是，我们现在在文本中添加了空白。填写这些内容并非易事。这是一个快速而肮脏的尝试，您可以将其用作起点:

lines = lines > 0.5
text = text > 0.5
lines -= dip.BinaryPropagation(text, lines, connectivity=-1, iterations=3)
img[lines] = 0

关于python - 从图像中去除噪声线，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54028493/

python - 从图像中去除噪声线

上一篇：python - 是什么导致 Pandas 出现 "indexing past lexsort depth"警告？

下一篇：python - 切片运算符的负边界