这个问题可能已经得到回答,但我没有找到一个简单的答案。我使用 Keras 创建了一个 convnet 来对辛普森一家的角色进行分类 ( dataset here )。
我有 20 个类并给出一个图像作为输入,我返回字符名称。这很简单。我的数据集包含图片中带有主角的图片,并且只有字符的名称作为标签。
现在我想添加一个对象检测问题,即在图片中的字符周围绘制一个边界框并预测它是哪个字符。我不想使用滑动窗口,因为它真的很慢。所以我考虑使用更快的 RCNN ( github repo ) 或 YOLO ( github repo )。我是否必须为训练集的每张图片添加边界框的坐标?有没有办法在不提供训练集坐标的情况下进行对象检测(并在我的测试中获得边界框)?
总而言之,我想创建一个简单的对象检测模型,不知道是否可以创建一个更简单的YOLO或Faster RCNN。
非常感谢您的帮助。
最佳答案
yolo 或 fast rcnn 的目标是获取边界框。简而言之,是的,您需要标记数据以对其进行训练。
走捷径:
训练集现在应该更大了。
关于deep-learning - 使用 Keras : simple way for faster R-CNN or YOLO 的对象检测,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44687230/