python - 使用 ssd_mobilenet_v2_quantized_300x300_coco 的对象检测模型的丢失在每 10k-12k 步后增加

标签 python tensorflow computer-vision object-detection

我正在自定义数据集上重新训练 ssd_mobilenet_v2_quantized_300x300_coco 对象检测模型。该数据集由大约 2.6k 张图像和 19 个类别组成。训练步数达到 10k-12k 后,损失图开始增加。即使我将模型更改为 ssd_mobilenet_v2_coco 并在相同的步长范围内,也会发生这种情况。我在配置文件中找不到与此行为相关的任何内容。当使用 faster_rcnn 模型时,这种情况也会消失。当问题出现时,mAP 几乎保持不变。而且准确率不会超过 50%。谁能解释一下这种行为?

示例数据集:

enter image description here

损失图

a) ssd_mobilenet_v2_quantized_300x300_coco ssd_mobilenet_v2_quantized_300x300_coco

b) ssd_mobilenet_v2_coco

enter image description here

配置文件: a) ssd_mobilenet_v2_quantized_300x300_coco

https://pastebin.com/BBwqEruK

b) ssd_mobilenet_v2_coco

https://pastebin.com/F8K0BhQV

最佳答案

你的训练损失怎么样?请注意,total_loss 是此处的验证损失。

如果你的训练损失在减少,而验证损失在增加,这显然是过度拟合的迹象,你可以在训练期间使用正则化损失,在配置文件中的 train_config 部分中添加以下内容

add_regularization_loss: true

就像batch_size: 24

关于python - 使用 ssd_mobilenet_v2_quantized_300x300_coco 的对象检测模型的丢失在每 10k-12k 步后增加,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55084951/

相关文章:

python - wx.ProgressDialog 在被销毁时导致段错误和/或 GTK_IS_WINDOW 失败

python - 使用 PySide 渲染 latex/mathml

python - 为 Django 模板定义 API?

c - 图像处理..背景减法

python - 生成结果值最接近要求的方程,有速度问题

android - 如何在 android studio 中使用 .tflite 模型进行图像分类

python - Tensorflow服务容器进入事件循环后Heroku Dyno崩溃

tensorflow:一级分类

opencv - 在 OpenCV 中使用 FindExtrinsicCameraParams2

opencv - 实时光流