我正在训练一个 tensorflow 对象检测模型,该模型已使用 COCO 进行预训练以识别单一类型/类别的对象。我的数据集中的某些图像包含此类对象的多个实例。
鉴于训练中使用的每条记录都有一个边界框,我想知道处理我的图像中可能包含多个同一类对象这一事实的最佳方法是什么。
- 我应该为多个记录使用同一个图像吗?
- 训练时会出现问题吗?
- 如果我可以拆分所述图像,使其仅包含一个对象,会不会更好?
最佳答案
Should I use the same image for multiple records?
不,因为图像中未注释为对象的任何内容都被归类为背景,这是隐式对象类型/类。因此,当您使用包含对象的图像训练模型,但该对象未正确注释时,模型的性能会下降(因为模型将该对象和其他类似实体视为背景)
Could that be problematic when training?
是的,这个问题将会严重影响模型的性能。事实上,最好的做法是添加一些其中没有任何对象的图像,并让模型将它们作为没有边界框实例的背景进行训练。
Would it be better if I could split said images so that they only contained one object?
是的,这会有所帮助。此外,您可以考虑为每个图像添加多个边界框。但切勿让任何对象没有带注释的边界框,即使该对象被截断或遮挡。
关于python - 在 tensorflow 对象检测模型的训练数据集中重复图像,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58480861/