machine-learning - 该模型无法使用更多数据产生更好的结果的原因可能是什么？

当我使用 Jeff Heatons 网站上的 Keras GAN 时。俗话说，我们拥有的数据越多，我们得到的结果就越好。我想检验这个假设。另外，我想知道 GAN 是否可以直接从数据中复制样本。

这就是为什么我创建了数字范围从 1 到 20000 的图像:

为了测试这个理论，我首先用 5000 张图像训练了 GAN。这是我得到的结果:

然后我用 20000 张图像进行训练:

我真的看不出有什么大的改进。是什么赋予了？我需要尝试更多图像(50,000 张)吗？我需要改进 GAN 的架构吗？

最佳答案

您不需要修改 GAN 的架构。

如果我是您，我会首先开始寻找一个好的指标来检查您的结果如何改善/恶化。

老实说，当我查看两个不同的批处理时，第二个批处理看起来更加多样化，因此 GAN 能够生成更广泛的数字是有道理的，因为它看到了更多的图片。

关于machine-learning - 该模型无法使用更多数据产生更好的结果的原因可能是什么？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59485171/