machine-learning - 该模型无法使用更多数据产生更好的结果的原因可能是什么?

标签 machine-learning keras generative-adversarial-network

当我使用 Jeff Heatons 网站上的 Keras GAN 时。 俗话说,我们拥有的数据越多,我们得到的结果就越好。我想检验这个假设。另外,我想知道 GAN 是否可以直接从数据中复制样本。

这就是为什么我创建了数字范围从 1 到 20000 的图像:

  • 128 像素 x 128 像素
  • 数字居中
  • 所有内容都使用相同的内容(深蓝色和黄色)

enter image description here

为了测试这个理论,我首先用 5000 张图像训练了 GAN。这是我得到的结果:

enter image description here

然后我用 20000 张图像进行训练:

enter image description here

我真的看不出有什么大的改进。是什么赋予了?我需要尝试更多图像(50,000 张)吗?我需要改进 GAN 的架构吗?

最佳答案

您不需要修改 GAN 的架构。

如果我是您,我会首先开始寻找一个好的指标来检查您的结果如何改善/恶化。

老实说,当我查看两个不同的批处理时,第二个批处理看起来更加多样化,因此 GAN 能够生成更广泛的数字是有道理的,因为它看到了更多的图片。

关于machine-learning - 该模型无法使用更多数据产生更好的结果的原因可能是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59485171/

相关文章:

python - 两个 100X100 多维数组的随机样本,具有相同的行号。在 python 中

machine-learning - K-means 文档聚类 - 接下来做什么?

python - 主成分分析不起作用

python - Keras:准确率保持为零

keras - 在 Keras 中,imagenet 预训练模型如何处理不同于原始 224x224 输入大小的输入大小?

machine-learning - 使用 GAN 为稀疏数据集生成数据

machine-learning - NLP:计算文档属于某个主题(带有词袋)的概率?

python - Keras 创建您自己的生成器

neural-network - 如何解释生成对抗网络中判别器的损失和生成器的损失?

neural-network - GAN中的模式丢弃和模式崩溃之间的区别?