我正在尝试对图像中的 ASCII 字符串进行 OCR 识别。我正在使用 Tesseract3 库,但是我在正确识别方面遇到了一些问题,因此我需要使用新字符集(这是特定的)对其进行训练。
我已经发现了这个操作方法:TrainingTesseract3 ,但是教程有一些我不需要的不必要的程序,因为我的图像测试集很简单。
我的图像数据集仅包含 1 衬垫 ,其中每个 ASCII 字符是 同 在所有图像中(无旋转,无缩放),但行中字符之间的距离可变(仅水平)。
如何使用字体图像来训练识别算法?
最佳答案
先生只需获取您想要训练的特定字体,然后在记事本中写下字母或数字(我认为 5 个代表/字母)另存为 tiff 文件。如果您想训练它,请使用此 https://code.google.com/p/serak-tesseract-trainer/ 中的任何一个或 http://vietocr.sourceforge.net/training.html .
关于pattern-matching - 使用预定义的字体图像训练 "tesseract ocr",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24063870/