java - 在进行字符识别(tesseract)之前使用 OpenCV 进行图像预处理

我正在尝试开发用于车牌识别的简单 PC 应用程序(Java + OpenCV + Tess4j)。图像不是很好(进一步它们会很好)。我想为 tesseract 预处理图像，但我卡在车牌检测(矩形检测)上。

我的步骤:

1)源图片

Mat img = new Mat();
img = Imgcodecs.imread("sample_photo.jpg"); 
Imgcodecs.imwrite("preprocess/True_Image.png", img);

2)灰度

Mat imgGray = new Mat();
Imgproc.cvtColor(img, imgGray, Imgproc.COLOR_BGR2GRAY);
Imgcodecs.imwrite("preprocess/Gray.png", imgGray);

3)高斯模糊

Mat imgGaussianBlur = new Mat(); 
Imgproc.GaussianBlur(imgGray,imgGaussianBlur,new Size(3, 3),0);
Imgcodecs.imwrite("preprocess/gaussian_blur.png", imgGaussianBlur);

4)自适应阈值

Mat imgAdaptiveThreshold = new Mat();
Imgproc.adaptiveThreshold(imgGaussianBlur, imgAdaptiveThreshold, 255, CV_ADAPTIVE_THRESH_MEAN_C ,CV_THRESH_BINARY, 99, 4);
Imgcodecs.imwrite("preprocess/adaptive_threshold.png", imgAdaptiveThreshold);

这里应该是第 5 步，检测板区域(现在可能甚至没有去偏移)。

我使用 Paint 从图像(第 4 步之后)裁剪了所需的区域，并得到:

然后我做了 OCR(通过 tesseract，tess4j):

File imageFile = new File("preprocess/adaptive_threshold_AFTER_PAINT.png");
ITesseract instance = new Tesseract();
instance.setLanguage("eng");
instance.setTessVariable("tessedit_char_whitelist", "acekopxyABCEHKMOPTXY0123456789");
String result = instance.doOCR(imageFile); 
System.out.println(result);

并得到(足够好？)结果 - “Y841ox EH”(几乎正确)

如何在第 4 步后检测和裁剪板区域？我必须在 1-4 个步骤中进行一些更改(改进)吗？希望看到一些通过 Java + OpenCV(不是 JavaCV)实现的示例。
提前致谢。

编辑(感谢@Abdul Fatir 的回答) 好吧，我为那些对此问题感兴趣的人提供了工作(至少对我而言)代码示例(Netbeans+Java+OpenCV+Tess4j)。代码不是最好的，但我只是为了学习而制作它。
http://pastebin.com/H46wuXWn(不要忘记将 tessdata 文件夹放入您的项目文件夹中)

最佳答案

以下是我建议您执行此任务的方法。