我正在自定义数据集上重新训练 ssd_mobilenet_v2_quantized_300x300_coco
对象检测模型。该数据集由大约 2.6k 张图像和 19 个类别组成。训练步数达到 10k-12k 后,损失图开始增加。即使我将模型更改为 ssd_mobilenet_v2_coco 并在相同的步长范围内,也会发生这种情况。我在配置文件中找不到与此行为相关的任何内容。当使用 faster_rcnn 模型时,这种情况也会消失。当问题出现时,mAP 几乎保持不变。而且准确率不会超过 50%。谁能解释一下这种行为?
示例数据集:
损失图
a) ssd_mobilenet_v2_quantized_300x300_coco
b) ssd_mobilenet_v2_coco
配置文件: a) ssd_mobilenet_v2_quantized_300x300_coco
b) ssd_mobilenet_v2_coco
最佳答案
你的训练损失怎么样?请注意,total_loss
是此处的验证损失。
如果你的训练损失在减少,而验证损失在增加,这显然是过度拟合的迹象,你可以在训练期间使用正则化损失,在配置文件中的 train_config
部分中添加以下内容
add_regularization_loss: true
就像batch_size: 24
关于python - 使用 ssd_mobilenet_v2_quantized_300x300_coco 的对象检测模型的丢失在每 10k-12k 步后增加,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55084951/