opencv - 图像分割技术

标签 opencv computer-vision ocr face-detection image-segmentation

我正在开发计算机视觉应用程序,但遇到了概念障碍。我需要识别视频中的一组 Logo ,到目前为止,我一直在使用特征匹配方法,如 SIFT(以及 Yu 和 Morel 的 ASIFT)、SURF、FERNS——基本上是“通用描述符匹配器的通用接口(interface)”中的所有内容OpenCV 文档的一部分。但最近我一直在研究 OCR/Random Trees 分类器中使用的方法(我正在玩这个数据集:http://archive.ics.uci.edu/ml/datasets/Letter+Recognition)并认为这可能是找到 Logo 的更好方法。问题是我找不到自动分割任意图像的可靠方法。

我的问题:

  1. 我是否应该费心研究描述符/关键点以外的方法,或者这是 识别典型 Logo (风格化、颜色少、边缘锐利)的最佳方式?
  2. 如何分割任意图像(或视频帧,在我的例子中)以便我可以正确
    与示例数据库匹配?
  3. HaarCascades 似乎以类似的方式工作(样本数据库),但我 无法弄清楚这些过程是如何相关的。那里有分割吗?

抱歉,这些问题太宽泛了。我正试图在几乎没有帮助的情况下全神贯注于这些东西。谢谢!

最佳答案

看来分割并不是你想要的。我认为它必须在对象检测和识别方面做更多的事情。您想要检测一组特定图像中是否存在一组特定 Logo 。这似乎与关于标记表面或具有常见颜色、纹理、形状等的区域的分割无关,尽管检查基于分割的方法可能会有用。

我肯定会鼓励您审视问题并检查所有可能应用的方法,而不仅仅是流行的方法(例如 SIFT、GLOH、SURF 等)。我建议您查看较早的、更简单的方法,例如简单的模板匹配、倒角等。

Haar 级联在 2000 年 Viola 和 Jones 发表了一篇用于人脸检测的论文后开始流行(类似于您在现代点击相机中看到的)。这听起来确实与您感兴趣的问题有点相似。您也许还应该检查问题的这一部分,但尽量不要过分关注学习部分。

关于opencv - 图像分割技术,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5279119/

相关文章:

c++ - 通过 Web 服务器远程运行 C++ 程序(Visual Studio 应用程序)

android - 从 vuforia 调用 OpenCV 方法

Matlab颜色检测

tensorflow - 如何用元信息丰富卷积神经网络?

image - tesseract 可以针对非字体符号进行训练吗?

android - 找不到mixed_sample.so

opencv - FlannBasedMatcher 使用哪个距离函数,如何更改?

computer-vision - 合并照片纹理 -(来自校准的相机) - 投影到几何体上

python - 如何将图像中的标题和标题与正文分开

python - 从具有不同结构的表单中提取字段