我正在尝试识别不同类型的车辆和 Logo 等。与该领域的大多数努力一样,挑战在于缺乏训练图像。
有人尝试过生成人造图像吗?通过在(例如)车辆引擎盖、车辆后部的顶部“绘制” Logo 并执行扭曲(例如改变颜色、形状等),为其提供更多样化的训练集。
此方法是否有指南和/或最佳实践?
编辑:投反对票的人,至少请评论一下您投反对票的原因,以便我可以学习。我并不是想在这个论坛上恶作剧,而是真诚地提出一个问题。如果您不同意,请分享您的想法。
最佳答案
数据增强是解决过度拟合问题的众所周知的技术。建议您通过对原始训练图像执行这些扭曲来实现此目的。这可以通过添加噪声、执行倾斜、旋转、裁剪随机窗口并对这些窗口进行训练来完成。这些只是一些例子。
对生成的图像执行此操作并不是最佳选择,因为生成的图像不如可用的训练图像。
从这个开始paper它解释了 AlexNet 并提到了他们使用的一些技巧,其中包括一些很好的数据增强。
关于deep-learning - 生成 "artificial"图像用于训练 CNN,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33740516/