neural-network - OCR 和神经元网络?

标签 neural-network ocr

我正在尝试为商店门票(在 Java 中)编写 OCR,我在图像字典距离方面有很好的结果,但对于倾斜的文本或糟糕的扫描却没有。
我听说神经元网络非常适合这个。

问题:您推荐哪种类型的神经元网络用于商店票据字符检测?

谢谢

最佳答案

神经网络不会神奇地为您解决问题。他们会遇到与您当前的方法类似的问题。在将其发送到分类器之前,您很可能必须检测并纠正它。

与不良扫描类似。这取决于糟糕的扫描究竟是什么。例如,一些神经网络在校正模糊(未聚焦的图像、移动模糊等)方面非常有效。

看看一些关于 OCR 和神经网络的论文。这是一个经典的话题,所以有很多。例如 The Anatomy of Bangla OCR System for Printed Texts Using Back Propagation Neural Network还尝试在运行神经网络之前解决倾斜图像的问题。

我知道循环神经网络可用于 OCR。即使是非常简单的字符也能轻松识别简单字符。最近有一篇论文对它们进行了改进:High-Performance OCR forPrinted English and Fraktur using LSTM Networks .它们甚至包括文本行规范化,这在您的情况下可能非常有用。

请注意,这里也有关于为 OCR 训练正常的前馈反向传播神经网络的答案:training feedforward neural network for OCR

关于neural-network - OCR 和神经元网络?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21661622/

相关文章:

python - 如何使用keras实现一个简单的神经网络

haskell - 如何在 Haskell 中对系统随时间的变化进行建模

python-2.7 - 为什么 pytesseract 导致 AttributeError : 'NoneType' object has no attribute 'bands' ?

python - 从图像中提取表格数据

tensorflow - 使用 tensorflow 合并在 2 台不同计算机上训练的同一模型的权重

machine-learning - 为什么U-net的上采样层没有激活函数?

machine-learning - 神经网络: Handling unavailable inputs (missing or incomplete data)

python - Tesseract OCR,读取低分辨率/像素化字体(尤其是数字)

python - 在 Windows Python 中将不可搜索的 Pdf 转换为可搜索的 Pdf

c# - 如何显示从 Tessnet (Tesseract) 获得的 tif 坐标图像