我有一个文本文件中的单词词典,以换行符分隔。我想使用 Tesseract 识别手写体,并输出文本文件中最接近的匹配行。
这是我第一次使用 Tesseract,它已经在我的项目工作区中,我只需要训练数据。
是否可以训练 Tesseract 来做到这一点?
最佳答案
可以训练超正方体来识别手写体。以下是说明:https://tesseract-ocr.github.io/tessdoc/Training-Tesseract
但是不要期望有很好的结果。学术界通常得到的准确率最高可达 90% 左右。以下是 words 的一些引用资料和 numbers 。因此,如果您的用例可以处理至少 1/10 的错误,那么这可能适合您。
关于android - 带有字典训练的 Tesseract 手写体,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12310287/