c# - 如何使用 Tesseract 提高结果识别?

标签 c# ocr tesseract text-recognition

我在用图片

enter image description here

我想从中识别数字

var engine = new TesseractEngine(@"./tessdata", "eng", EngineMode.TesseractOnly);
engine.SetVariable("tessedit_char_whitelist", "0123456789");
var img = Pix.LoadFromFile(@"D:/Ex.png");
var page = engine.Process(img);
var text = page.GetText();
Console.Write("Press any key to continue . . . ");
Console.ReadKey(true);

结果非常糟糕 31 3 963 如何改进?

最佳答案

您可以使用您的 pic 替换 eng 来训练您自己的 tessdata 文件。 从github(https://github.com/tesseract-ocr/tesseract),and阅读wiki(https://github.com/tesseract-ocr/tesseract/wiki/Training-Tesseract-3.00 –3.02))下载tesseract-ocr的源代码,它可以帮助你训练你的tessdata。 希望对您有所帮助。

关于c# - 如何使用 Tesseract 提高结果识别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38474483/

相关文章:

php - 仅选择图像的特定部分

java - 如何关闭tess4j中的字典?

python-tesseract OCR : get digits only

c# - 在不创建新矩阵变换的情况下设置图像的布局变换

python - 使用opencv识别OCR期间的元音字符

c# - 如何在 CaptureElement 中旋转相机 View ?

artificial-intelligence - 我可以将字典数字化吗?

linux - 我在 centos 6 上安装 tesseract 时遇到此错误 sudo yum install $HOME/rpmbuild/RPMS/$(uname -m)/tesseract{,-devel}-3.02-*.rpm

c# - MEF ImportMany 类型参数 : elegant solution?

c# - await a Task with a loop 谁也在等待