deep-learning - 使用 Keras : simple way for faster R-CNN or YOLO 的对象检测

标签 deep-learning classification keras object-detection

这个问题可能已经得到回答，但我没有找到一个简单的答案。我使用 Keras 创建了一个 convnet 来对辛普森一家的角色进行分类 ( dataset here )。
我有 20 个类并给出一个图像作为输入，我返回字符名称。这很简单。我的数据集包含图片中带有主角的图片，并且只有字符的名称作为标签。

现在我想添加一个对象检测问题，即在图片中的字符周围绘制一个边界框并预测它是哪个字符。我不想使用滑动窗口，因为它真的很慢。所以我考虑使用更快的 RCNN ( github repo ) 或 YOLO ( github repo )。我是否必须为训练集的每张图片添加边界框的坐标？有没有办法在不提供训练集坐标的情况下进行对象检测(并在我的测试中获得边界框)？

总而言之，我想创建一个简单的对象检测模型，不知道是否可以创建一个更简单的YOLO或Faster RCNN。

非常感谢您的帮助。

最佳答案

yolo 或 fast rcnn 的目标是获取边界框。简而言之，是的，您需要标记数据以对其进行训练。

走捷径:

1) 标记一些边界框(假设每个字符 5 个)。

2) 在非常小的数据集上训练更快的 rcnn 或 yolo。

3) 针对完整数据集运行模型

4)它会得到一些正确的，得到很多错误。

5)在正确有界的那些上训练更快的rcnn，你的
训练集现在应该更大了。

6)重复直到你得到你想要的结果。

关于deep-learning - 使用 Keras : simple way for faster R-CNN or YOLO 的对象检测，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/44687230/