opencv - 咖啡 bean 分离算法

标签 opencv image-processing computer-vision

在二进制图像上分离(计数)咖啡 bean 的正确算法是什么? bean 可以接触并部分重叠。

coffee beans image
(来源:beucher at cmm.ensmp.fr)

我实际上不是在用咖啡 bean 工作,但用咖啡 bean 更容易描述。这是我的任务中的子问题,计算所有在场的人和计算从超市监控视频中越过某条假想线的人。我已经将移动对象提取到二进制掩码中,现在我需要以某种方式将它们分开。

有人在评论中提到的两个有前途的算法:

  • Wathershed+distancetransofrm+labeling。这可能是我提出的这个问题的答案( bean 分离)。
  • 跟踪视频序列中的移动对象(此算法的名称是什么?)。它可以跟踪重叠的对象。这是更有前途的算法,可能正是我解决我的任务(移动人员分离)所需要的。

最佳答案

这种方法是 spin-off from mmgp's answer详细解释了分水岭算法的工作原理。因此,如果您需要对代码的作用进行一些解释,请查看他的回答。

可以玩代码以提高检测率。在这里:

import sys
import cv2
import numpy
from scipy.ndimage import label

def segment_on_dt(a, img):
    border = cv2.dilate(img, None, iterations=3)
    border = border - cv2.erode(border, None)
    cv2.imwrite("border.png", border)

    dt = cv2.distanceTransform(img, 2, 5)    
    dt = ((dt - dt.min()) / (dt.max() - dt.min()) * 255).astype(numpy.uint8)
    _, dt = cv2.threshold(dt, 135, 255, cv2.THRESH_BINARY)
    cv2.imwrite("dt_thres.png", dt)    

border(左),dt(右):

enter image description here enter image description here

    lbl, ncc = label(dt)
    lbl = lbl * (255/ncc)      
    # Completing the markers now. 
    lbl[border == 255] = 255

    lbl = lbl.astype(numpy.int32)
    cv2.imwrite("label.png", lbl)

lbl:

enter image description here

    cv2.watershed(a, lbl)

    lbl[lbl == -1] = 0
    lbl = lbl.astype(numpy.uint8)
    return 255 - lbl

# Application entry point
img = cv2.imread("beans.png")
if img == None:
    print("!!! Failed to open input image")
    sys.exit(0)

# Pre-processing.
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)    
_, img_bin = cv2.threshold(img_gray, 128, 255, cv2.THRESH_OTSU | cv2.THRESH_BINARY_INV)
cv2.imwrite("img_bin.png", img_bin)

img_bin = cv2.morphologyEx(img_bin, cv2.MORPH_OPEN, numpy.ones((3, 3), dtype=int))
cv2.imwrite("img_bin_morphoEx.png", img_bin)

img_bin(左)形态学操作前后(右):

enter image description here enter image description here

result = segment_on_dt(img, img_bin)
cv2.imwrite("result.png", result)

result[result != 255] = 0
result = cv2.dilate(result, None)
img[result == 255] = (0, 0, 255)
cv2.imwrite("output.png", img)
分水岭分割的

结果(左),然后是输出(右):

enter image description here enter image description here

关于opencv - 咖啡 bean 分离算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25789278/

相关文章:

c++ - 使用 opencv 中的文件存储将多个 Mat 变量写入 XML 文件

c++ - Opencv Findcontours导致堆错误

python - 使用 yield 而不是 return 创建函数以连续从 http 流生成帧

matlab - 不裁剪的图像重映射

python - 我如何通过 python 方式使用 opencv 在图像中找到篮球?

image - 对图像文件中的类型样本进行分类

machine-learning - 微小的 YOLOv3(暗网)训练 "too quickly"并产生不同的输出

python - 从实时非 youtube 视频流中提取图像帧

java - Opencv android 应用程序在新 Activity 时崩溃

opencv - 如何改进物体检测?