deep-learning - 使用 Keras : simple way for faster R-CNN or YOLO 的对象检测

标签 deep-learning classification keras object-detection

这个问题可能已经得到回答,但我没有找到一个简单的答案。我使用 Keras 创建了一个 convnet 来对辛普森一家的角色进行分类 ( dataset here )。
我有 20 个类并给出一个图像作为输入,我返回字符名称。这很简单。我的数据集包含图片中带有主角的图片,并且只有字符的名称作为标签。

现在我想添加一个对象检测问题,即在图片中的字符周围绘制一个边界框并预测它是哪个字符。我不想使用滑动窗口,因为它真的很慢。所以我考虑使用更快的 RCNN ( github repo ) 或 YOLO ( github repo )。我是否必须为训练集的每张图片添加边界框的坐标?有没有办法在不提供训练集坐标的情况下进行对象检测(并在我的测试中获得边界框)?

总而言之,我想创建一个简单的对象检测模型,不知道是否可以创建一个更简单的YOLO或Faster RCNN。

非常感谢您的帮助。

最佳答案

yolo 或 fast rcnn 的目标是获取边界框。简而言之,是的,您需要标记数据以对其进行训练。

走捷径:

  • 1) 标记一些边界框(假设每个字符 5 个)。
  • 2) 在非常小的数据集上训练更快的 rcnn 或 yolo。
  • 3) 针对完整数据集运行模型
  • 4)它会得到一些正确的,得到很多错误。
  • 5)在正确有界的那些上训练更快的rcnn,你的
    训练集现在应该更大了。
  • 6)重复直到你得到你想要的结果。
  • 关于deep-learning - 使用 Keras : simple way for faster R-CNN or YOLO 的对象检测,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44687230/

    相关文章:

    algorithm - kNN 是统计分类器吗?

    machine-learning - 在 Weka 中对单实例进行分类

    python - 导入keras时出错 ModuleNotFoundError : No module named 'tensorflow.examples' ; 'tensorflow' is not a package

    python - 为什么调用方法在构建时在 Keras 层中被调用

    tensorflow - 不平衡数据集上的一类文本分类

    machine-learning - 对于深度学习,使用激活 relu,输出在训练期间变为 NAN,而使用 tanh 则输出正常

    Tensorflow - 损失开始很高并且不会减少

    machine-learning - 线性自动编码器如何等于 PCA?

    machine-learning - BERT 的表现比 word2vec 差

    java - 基本的 deeplearning4j 分类示例