java - 使用 javacv 进行 OCR

标签 java ocr javacv

我正在为我的项目制作 OCR 并卡在一个点上,现在我正在根据轮廓执行分割,它在很少的图像上工作正常,但即使图像质量很好,也很少有失败的地方,我如果有人建议我更准确的方法,并且如果有人提供代码示例,这是我当前的代码,我将不胜感激。

public static void imageBinarization(IplImage src, IplImage dst){
    IplImage r, g, b, s;
        r = cvCreateImage(cvGetSize(src), IPL_DEPTH_8U, 1);
        g = cvCreateImage(cvGetSize(src), IPL_DEPTH_8U, 1);
        b = cvCreateImage(cvGetSize(src), IPL_DEPTH_8U, 1);

        cvSplit(src, r, g, b, null);

        s = cvCreateImage(cvGetSize(src), IPL_DEPTH_8U, 1);

        cvAddWeighted(r, 1./3., g, 1./3., 0.0, s);
        cvAddWeighted(s, 2./3., b, 1./3., 0.0, s);
        cvThreshold(s, dst, 100, 100, CV_THRESH_BINARY_INV);
        cvReleaseImage(r);
        cvReleaseImage(g);
        cvReleaseImage(b);
        cvReleaseImage(s);
}
public static void imageSegmentation(String sourcePath, String targetPath){
    cvConvert(t0, mat0);
    cvConvert(t8, mat8);
    cvConvert(t9, mat9);

    IplImage image = cvLoadImage(sourcePath);
    IplImage grayImage = cvCreateImage(cvGetSize(image), IPL_DEPTH_8U, 1);

    //cvSmooth(image, image, CV_BLUR_NO_SCALE, 2);

    //cvSmooth(image, image, CV_BLUR, 9, 9, 2, 2);

    //cvSmooth(image, image, CV_GAUSSIAN, 3);

    imageBinarization(image, grayImage);



    CvMemStorage mem;
    CvSeq contours = new CvSeq();
    CvSeq ptr = new CvSeq();
    mem = cvCreateMemStorage(0);
    CvRect rect = null;
    int px1,px2, py1, py2;

    CvScalar blue = CV_RGB(0, 0, 250);
    int n = 0; int i = 0;
    cvFindContours(grayImage, mem, contours, sizeof(CvContour.class) , CV_RETR_CCOMP, CV_CHAIN_APPROX_SIMPLE, cvPoint(0,0));

    Random rand = new Random();
    for (ptr = contours; ptr != null; ptr = ptr.h_next()) {

        Color randomColor = new Color(rand.nextFloat(), rand.nextFloat(), rand.nextFloat());
        CvScalar color = CV_RGB( randomColor.getRed(), randomColor.getGreen(), randomColor.getBlue());

        rect =  cvBoundingRect(ptr, n);//new CvRect(cvGetSeqElem(c, c.total()));
        px1 = rect.x(); py1 = rect.y(); px2 = (rect.x() + rect.width()); py2 = (rect.y() + rect.height());
        cvRectangle(image, cvPoint(px1, py1), cvPoint(px2, py2), blue, 1, CV_AA, 0);

        //----
        xbox = rect.x(); ybox = rect.y(); wbox = rect.width(); hbox = rect.height();
        img = cvCreateImage(cvSize(wbox, hbox), image.depth(), image.nChannels());
        cvSetImageROI(image, cvRect(xbox, ybox, wbox, hbox));
        cvCopy(image, img);
        cvResetImageROI(image);

        //cvSaveImage(targetPath+i+".jpg", img);
        i++;
        //---
        //cvDrawContours(image, ptr, color, CV_RGB(0,0,0), -1, CV_FILLED, 8, cvPoint(0,0));
    }
    cvSaveImage(targetPath+"mat.jpg", image);
}

最佳答案

尝试使用一些全局阈值算法,例如 Otsu。但 JavaCV 还没有实现这一点。因此,尝试使用直方图处理找到 Otsu 阈值级别并将该值应用于

cvThreshold(s, dst, 100, 100, CV_THRESH_BINARY_INV);

关于java - 使用 javacv 进行 OCR,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9648482/

相关文章:

java - 如何在java中调用2个不同类的2个不同方法到我自己的类?

c++ - 从两个图像中选择最佳 OCR 输入

c# - OCR TesseractEngine

javaCV ffmpeg Android N链接器错误

c++ - JavaCV 中的密集光流 (DualTVL1)

java - 使用网络摄像头改进条形码扫描 - Java

java - 与 Java 一起使用时,Python 提供了哪些额外功能?

java - 如何在Spring集成中连接到远程MBean服务器

java - 无法解析符号

javascript - 用于从网络读取和操作图像的客户端脚本(详细信息...)