我的目标是描绘其中有很多独立形状的绘图,并将这些形状拆分成单独的图像。它是白底黑字。我对 numpy、opencv&co 很陌生——但这是我目前的想法:
- 扫描黑色像素
- 发现黑色像素 -> 分水岭
- 找到分水岭边界(作为多边形路径)
- 继续搜索,但忽略已找到边界内的点
我不太擅长这类事情,有没有更好的方法?
首先我试图找到分水岭结果的矩形边界框(这或多或少是一些例子的拼贴):
from numpy import *
import numpy as np
from scipy import ndimage
np.set_printoptions(threshold=np.nan)
a = np.zeros((512, 512)).astype(np.uint8) #unsigned integer type needed by watershed
y, x = np.ogrid[0:512, 0:512]
m1 = ((y-200)**2 + (x-100)**2 < 30**2)
m2 = ((y-350)**2 + (x-400)**2 < 20**2)
m3 = ((y-260)**2 + (x-200)**2 < 20**2)
a[m1+m2+m3]=1
markers = np.zeros_like(a).astype(int16)
markers[0, 0] = 1
markers[200, 100] = 2
markers[350, 400] = 3
markers[260, 200] = 4
res = ndimage.watershed_ift(a.astype(uint8), markers)
unique(res)
B = argwhere(res.astype(uint8))
(ystart, xstart), (ystop, xstop) = B.min(0), B.max(0) + 1
tr = a[ystart:ystop, xstart:xstop]
print tr
不知何故,当我使用原始数组 (a) 时,argwhere 似乎可以工作,但在分水岭 (res) 之后,它只是再次输出完整的数组。
下一步可能是找到形状周围的多边形路径,但现在边界框会很棒!
请帮忙!
最佳答案
@Hooked 已经回答了你的大部分问题,但他回答时我正在写这篇文章,所以我会发布它,希望它仍然有用......
您试图跳过太多的障碍。您不需要 watershed_ift
。
您使用 scipy.ndimage.label
来区分 bool 数组中的单独对象,并使用 scipy.ndimage.find_objects
来查找每个对象的边界框。
让我们把事情分解一下。
import numpy as np
from scipy import ndimage
import matplotlib.pyplot as plt
def draw_circle(grid, x0, y0, radius):
ny, nx = grid.shape
y, x = np.ogrid[:ny, :nx]
dist = np.hypot(x - x0, y - y0)
grid[dist < radius] = True
return grid
# Generate 3 circles...
a = np.zeros((512, 512), dtype=np.bool)
draw_circle(a, 100, 200, 30)
draw_circle(a, 400, 350, 20)
draw_circle(a, 200, 260, 20)
# Label the objects in the array.
labels, numobjects = ndimage.label(a)
# Now find their bounding boxes (This will be a tuple of slice objects)
# You can use each one to directly index your data.
# E.g. a[slices[0]] gives you the original data within the bounding box of the
# first object.
slices = ndimage.find_objects(labels)
#-- Plotting... -------------------------------------
fig, ax = plt.subplots()
ax.imshow(a)
ax.set_title('Original Data')
fig, ax = plt.subplots()
ax.imshow(labels)
ax.set_title('Labeled objects')
fig, axes = plt.subplots(ncols=numobjects)
for ax, sli in zip(axes.flat, slices):
ax.imshow(labels[sli], vmin=0, vmax=numobjects)
tpl = 'BBox:\nymin:{0.start}, ymax:{0.stop}\nxmin:{1.start}, xmax:{1.stop}'
ax.set_title(tpl.format(*sli))
fig.suptitle('Individual Objects')
plt.show()
希望这能让我们更清楚地了解如何找到对象的边界框。
关于python - 使用 numpy/scipy 进行形状识别(也许是分水岭),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9689173/