machine-learning - 图像中的 Logo 识别

标签 machine-learning computer-vision image-recognition

有谁知道最近在图像中的 Logo 识别方面所做的学术工作吗? 请仅在您熟悉该特定主题的情况下回答(我可以自己在 Google 中搜索“ Logo 识别”,非常感谢)。 任何精通计算机视觉并做过物体识别工作的人也欢迎发表评论。

更新: 请引用算法方面(您认为合适的方法、该领域的论文、它是否应该适用于现实世界的数据(并且已经过测试)、效率考虑),而不是技术方面(使用的编程语言或是否适用)。是用 OpenCV 的……) 图像索引和基于内容的图像检索方面的工作也会有所帮助。

最佳答案

您可以尝试在此处使用 SIFT 等本地功能: http://en.wikipedia.org/wiki/Scale-invariant_feature_transform

它应该可以工作,因为 Logo 形状通常是恒定的,因此提取的特征应该很好匹配。

工作流程如下:

  1. 检测角点(例如 Harris 角点检测器)- 对于 Nike Logo ,它们是两个尖锐的末端。

  2. 计算描述符(如 SIFT - 128D 整数向量)

  3. 在训练阶段记住它们;在匹配阶段,为训练期间获得的数据库中的每个特征找到最近邻。最后,您得到了一组匹配项(其中一些可能是错误的)。

  4. 使用 RANSAC 排除错误的匹配。因此,您将获得描述从理想 Logo 图像到您找到 Logo 的图像的变换的矩阵。根据设置,您可以允许不同类型的变换(仅平移;平移和旋转;仿射变换)。

Szeliski 的书中有一章 (4.1) 介绍了本地特色。 http://research.microsoft.com/en-us/um/people/szeliski/Book/

附注

  1. 我假设您想在照片中查找 Logo ,例如查找所有百事可乐广告牌,因此它们可能会被扭曲。如果您需要在屏幕上找到电视 channel Logo (以便它不会旋转和缩放),您可以更轻松地完成(模式匹配或其他操作)。

  2. 传统的 SIFT 不考虑颜色信息。由于 Logo 通常具有恒定的颜色(尽管确切的颜色取决于闪电和相机),您可能需要以某种方式考虑颜色信息。

关于machine-learning - 图像中的 Logo 识别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2074956/

相关文章:

machine-learning - 使用 tensorflow 预测车祸

python - TensorFlow "tf.image"在 4D 图像批处理上运行

apache-spark - 从平均序列预测下一个事件

java - 神经网络 : classify as nothing?

java - 绘制检测到的物体的形状?

android - 不使用互联网的图像识别

c# - 在较大的图像中查找图像位置

machine-learning - 将同一物体的多个图像输入神经网络进行物体检测的方法

python - 在 TF.Keras 中使用自定义模型进行梯度累积?

machine-learning - 全卷积网络感受野