我正在开发计算机视觉应用程序,但遇到了概念障碍。我需要识别视频中的一组 Logo ,到目前为止,我一直在使用特征匹配方法,如 SIFT(以及 Yu 和 Morel 的 ASIFT)、SURF、FERNS——基本上是“通用描述符匹配器的通用接口(interface)”中的所有内容OpenCV 文档的一部分。但最近我一直在研究 OCR/Random Trees 分类器中使用的方法(我正在玩这个数据集:http://archive.ics.uci.edu/ml/datasets/Letter+Recognition)并认为这可能是找到 Logo 的更好方法。问题是我找不到自动分割任意图像的可靠方法。
我的问题:
- 我是否应该费心研究描述符/关键点以外的方法,或者这是 识别典型 Logo (风格化、颜色少、边缘锐利)的最佳方式?
- 如何分割任意图像(或视频帧,在我的例子中)以便我可以正确
与示例数据库匹配? - HaarCascades 似乎以类似的方式工作(样本数据库),但我 无法弄清楚这些过程是如何相关的。那里有分割吗?
抱歉,这些问题太宽泛了。我正试图在几乎没有帮助的情况下全神贯注于这些东西。谢谢!
最佳答案
看来分割并不是你想要的。我认为它必须在对象检测和识别方面做更多的事情。您想要检测一组特定图像中是否存在一组特定 Logo 。这似乎与关于标记表面或具有常见颜色、纹理、形状等的区域的分割无关,尽管检查基于分割的方法可能会有用。
我肯定会鼓励您审视问题并检查所有可能应用的方法,而不仅仅是流行的方法(例如 SIFT、GLOH、SURF 等)。我建议您查看较早的、更简单的方法,例如简单的模板匹配、倒角等。
Haar 级联在 2000 年 Viola 和 Jones 发表了一篇用于人脸检测的论文后开始流行(类似于您在现代点击相机中看到的)。这听起来确实与您感兴趣的问题有点相似。您也许还应该检查问题的这一部分,但尽量不要过分关注学习部分。
关于opencv - 图像分割技术,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5279119/