我已经完成了一个关于模式识别的简单项目。
我使用反向传播和多层神经网络来识别 10 个字母。
这非常艰难,我在与本地最低标准和缓慢的训练作斗争时遇到了很多麻烦。
但是,这个程序还是奏效了。
当然,这可能只是我的错误代码:)
现在我想改进我的结果并使用所有 26 个字母。此外,训练数据可能更复杂(至少是更大的图像)。所以我有点担心我可能会使用错误的方法。
您认为有什么帮助?
也许我应该结合使用遗传算法和神经网络?
还是使用更复杂的网络拓扑? (想到Ward网络和训练算法)
我想提一下,我没有使用任何 OCR 库,这只是一个教育项目。
如果有人能给我建议就太好了。谢谢。
最佳答案
尝试 resilient propagation培训。
我在普通 Rprop 培训方面取得了巨大成功。至于 ANN 拓扑,正常的前馈适用于图像处理。您可以尝试使用 Self-organizing map 进行试验如果所有字母的字体相同且尺寸较小(可能是 4x4),则输出可能表示字母。
关于algorithm - 图像识别的良好神经网络拓扑和训练方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22135675/