machine-learning - 图像中的 Logo 识别

已结束。此问题正在寻求书籍、工具、软件库等的推荐。它不满足Stack Overflow guidelines 。目前不接受答案。

我们不允许提出寻求书籍、工具、软件库等推荐的问题。您可以编辑问题，以便用事实和引文来回答。

已关闭 7 年前。

有谁知道最近在图像中的 Logo 识别方面所做的学术工作吗？请仅在您熟悉该特定主题的情况下回答(我可以自己在 Google 中搜索“ Logo 识别”，非常感谢)。任何精通计算机视觉并做过物体识别工作的人也欢迎发表评论。

更新: 请引用算法方面(您认为合适的方法、该领域的论文、它是否应该适用于现实世界的数据(并且已经过测试)、效率考虑)，而不是技术方面(使用的编程语言或是否适用)。是用 OpenCV 的……) 图像索引和基于内容的图像检索方面的工作也会有所帮助。

最佳答案

它应该可以工作，因为 Logo 形状通常是恒定的，因此提取的特征应该很好匹配。

工作流程如下:

检测角点(例如 Harris 角点检测器)- 对于 Nike Logo ，它们是两个尖锐的末端。
计算描述符(如 SIFT - 128D 整数向量)
在训练阶段记住它们；在匹配阶段，为训练期间获得的数据库中的每个特征找到最近邻。最后，您得到了一组匹配项(其中一些可能是错误的)。
使用 RANSAC 排除错误的匹配。因此，您将获得描述从理想 Logo 图像到您找到 Logo 的图像的变换的矩阵。根据设置，您可以允许不同类型的变换(仅平移；平移和旋转；仿射变换)。

附注

我假设您想在照片中查找 Logo ，例如查找所有百事可乐广告牌，因此它们可能会被扭曲。如果您需要在屏幕上找到电视 channel Logo (以便它不会旋转和缩放)，您可以更轻松地完成(模式匹配或其他操作)。
传统的 SIFT 不考虑颜色信息。由于 Logo 通常具有恒定的颜色(尽管确切的颜色取决于闪电和相机)，您可能需要以某种方式考虑颜色信息。

关于machine-learning - 图像中的 Logo 识别，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/2074956/