我正在应用tensorflow对象检测api来构建模型来检测单个对象。我自己的数据集包含 2150 个用于训练的图像和 540 个用于测试的图像。
所有图像的尺寸均为 1920(宽)x 1080(高)。每幅图像中的物体都非常小,大约为 55 x 15。此外,还有很多噪点。这是正确识别的我的数据集的示例图像(大多数图像无法识别):
我已经尝试了 detetion_model_zoo 中的所有型号,他们都没有给我满意的结果。 训练后 mAP 非常低。精度仅为0.3左右。以下是使用ssd_inception_v2_coco
的评估:
对改进模型有什么建议吗?非常感谢!
最佳答案
我会推荐以下内容:
1) 将图像分成更小的裁剪,以便感兴趣的对象最终变得更大一些。您可以仅在推理时执行此操作,也可以同时对裁剪进行训练和推理。如果某些裁剪不包含任何有趣的东西,请不要担心。
2) 使用更强大的模型,例如带有 resnet 或 inception resnet 的更快的 r-cnn。
3) 弄清楚人类的表现是什么,以了解机器学习系统的性能上限可能是多少。
关于python - 如何使用tensorflow对象检测API提高对象检测的精度?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46161027/