我目前正在使用tensorflow和mnist代码。 Yann Lecun 的 mnist 数据集包含 20x20 像素图像,通过计算像素的质心将其置于 28x28 图像的中心。结果是至少有 4 个像素的边框,从而改善了结果分析。我在 mnist 上搜索并阅读了很多内容,但我找不到为什么使用 4 个像素。 我正在计算 100x100 像素图像,其中有 5 像素边框,但我不知道这是否足够。我可以尝试更改边框大小并比较结果,但这需要很长时间。我认为知识和应用良好实践更好。那么如何定义最佳边框尺寸呢?
最佳答案
根据我的经验,在 MNIST 之外使用边框根本不常见。如果您尝试识别图像中的对象(而不是数字),您应该只提供整个图像,可能会进行一些随机裁剪或其他扭曲以帮助学习过程。其他任务的最佳实践会因领域而异,但通常来自对模型在生产中可能遇到的输入的相当常识性的直觉。
关于tensorflow - Mnist 像素边框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37727803/