python - 使用 ssd_mobilenet_v2_quantized_300x300_coco 的对象检测模型的丢失在每 10k-12k 步后增加

标签 python tensorflow computer-vision object-detection

我正在自定义数据集上重新训练 ssd_mobilenet_v2_quantized_300x300_coco 对象检测模型。该数据集由大约 2.6k 张图像和 19 个类别组成。训练步数达到 10k-12k 后，损失图开始增加。即使我将模型更改为 ssd_mobilenet_v2_coco 并在相同的步长范围内，也会发生这种情况。我在配置文件中找不到与此行为相关的任何内容。当使用 faster_rcnn 模型时，这种情况也会消失。当问题出现时，mAP 几乎保持不变。而且准确率不会超过 50%。谁能解释一下这种行为？

示例数据集:

损失图

a) ssd_mobilenet_v2_quantized_300x300_coco

b) ssd_mobilenet_v2_coco

配置文件: a) ssd_mobilenet_v2_quantized_300x300_coco

https://pastebin.com/BBwqEruK

b) ssd_mobilenet_v2_coco

https://pastebin.com/F8K0BhQV

最佳答案

你的训练损失怎么样？请注意，total_loss 是此处的验证损失。

如果你的训练损失在减少，而验证损失在增加，这显然是过度拟合的迹象，你可以在训练期间使用正则化损失，在配置文件中的 train_config 部分中添加以下内容

add_regularization_loss: true

就像batch_size: 24

关于python - 使用 ssd_mobilenet_v2_quantized_300x300_coco 的对象检测模型的丢失在每 10k-12k 步后增加，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55084951/

上一篇：scala - Scala 中可通过 FoldLeft 读取 FoldRight

下一篇：r - Cowplot 包 : Aligning text labels in the top lefthand corner of plot space using plot_grid() in R

python - 使用 PySide 渲染 latex/mathml

python - 为 Django 模板定义 API？

c - 图像处理..背景减法

python - 生成结果值最接近要求的方程，有速度问题

android - 如何在 android studio 中使用 .tflite 模型进行图像分类

python - Tensorflow服务容器进入事件循环后Heroku Dyno崩溃

tensorflow:一级分类

opencv - 在 OpenCV 中使用 FindExtrinsicCameraParams2

opencv - 实时光流