我正在为 ios 上的 tesseract ocr 而苦苦挣扎。一切正常,但速度真的很慢。 单行数字的识别时间为 2 - 3 秒。
我正在阅读视频流。
我正在使用 tesseract 3.01 和我的字体的自定义训练文件。
这是我的做法:
设置 tesseract 仅查找数字 (0-9)
- 缩小、校正和二值化图像
- 使用
GetLines
找到我想要的行 setRectangle
只识别我想要的行getUTF8Text
获取我的文本<- 仅此一项就需要 2-3 秒
有什么建议可以加快这个过程吗?
最佳答案
我切换到tesseract 3.02的SVN
在交叉编译遇到一些问题后,
我为 getUTF8Text 减少了大约 1.2 - 0.8 秒 0.3 - 0.2 秒用于图像预处理。
我做了一些测试
- 二值化和缩小 0.7 获得 0.3 秒但花费 0.1
- chop_enable=0 对速度几乎没有影响,平均速度增益为 0.1,但如果进行分析,它占 CPU 使用率的 50%
可用性方面的主要收获是使用 setRectangle 优化代码,而不是调用 getUTF8Text 如果我怀疑界限不正确。和一些字符串后处理通过检查 收到字符串并应用一些算法来消除最常见的误解 来自 tesseract。
也许这对其他人有用。
关于ios - 如何让 iOS 上的 tesseract 更快?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11630640/