您好,我想生成 tesseract OCR 训练数据文件(tessdata)。我正在使用 jTessBoxEditor 工具(在 Mac Os 上)来实现此目的,但我不知道如何使用这个工具。此外,我在 ios 应用程序中使用 tessdata 文件。
我也在寻找这个我与你分享链接
http://vietocr.sourceforge.net/training.html
http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3
但我没有运气:(。所以请分享通过训练文件(teasdata 文件)的陡峭实现提供详细/陡峭的链接。
最佳答案
这里是 tess 文件的下载 http://code.google.com/p/tesseract-ocr/downloads/detail?name=tesseract-ocr-setup-3.02.02.exe&can=2&q=
我和你的想法是一致的,让这个工作发挥作用。这是我使用的图。 http://www.resolveradiologic.com/blog/2013/01/15/training-tesseract/
我了解到您需要一个 .tif 文件和一个 .box 文件位于同一文件夹中才能加载框。 例如
testdata.tif
testdata.box
anotherExample.eng.tif
anotherExmaple.eng.box
如果您在下载并安装 tesseract 文件后不知道如何执行此操作,则可以轻松创建 box 文件。
->Open command prompt and CD to your tesseract file, which is usually in your programfiles/Tesseract-ocr folder
-> Run Box creator tesseract C:\location of the tif file\thetiffile.tif C:\location of the tif file\thetiffile.tif batch.nochop makebox
这应该会输出您需要的盒子文件。
我正在经历和发现的过程中。我会及时通知你的。如果您有任何其他问题,请告诉我,也许我可以提供帮助。
关于ios - 使用 jTessBoxEdit 训练 Tesseract ocr,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20879146/