我正在尝试为商店门票(在 Java 中)编写 OCR,我在图像字典距离方面有很好的结果,但对于倾斜的文本或糟糕的扫描却没有。
我听说神经元网络非常适合这个。
问题:您推荐哪种类型的神经元网络用于商店票据字符检测?
谢谢
最佳答案
神经网络不会神奇地为您解决问题。他们会遇到与您当前的方法类似的问题。在将其发送到分类器之前,您很可能必须检测并纠正它。
与不良扫描类似。这取决于糟糕的扫描究竟是什么。例如,一些神经网络在校正模糊(未聚焦的图像、移动模糊等)方面非常有效。
看看一些关于 OCR 和神经网络的论文。这是一个经典的话题,所以有很多。例如 The Anatomy of Bangla OCR System for Printed Texts Using Back Propagation Neural Network还尝试在运行神经网络之前解决倾斜图像的问题。
我知道循环神经网络可用于 OCR。即使是非常简单的字符也能轻松识别简单字符。最近有一篇论文对它们进行了改进:High-Performance OCR forPrinted English and Fraktur using LSTM Networks .它们甚至包括文本行规范化,这在您的情况下可能非常有用。
请注意,这里也有关于为 OCR 训练正常的前馈反向传播神经网络的答案:training feedforward neural network for OCR
关于neural-network - OCR 和神经元网络?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21661622/