opencv - 警告:无效的分辨率0 dpi。改用70

标签 opencv ocr tesseract leptonica

我知道这个主题已经存在,但是我没有找到任何解决方案。
我试图在下面的代码中从图片中检测字符:

#include <tesseract/baseapi.h>
#include <leptonica/allheaders.h>
#include <opencv2/opencv.hpp>

#include <sstream>
#include <memory>
#include <iostream>

#define path "/home/jovan/Pictures/"

void resize(cv::Mat &img);
PIX *mat8ToPix(const cv::Mat *mat8);
cv::Mat pix8ToMat(PIX *pix8);

int main(int argc, char **argv)
{
    // Load image
    std::stringstream ss;
    ss << path;
    ss << argv[1];
    cv::Mat im = cv::imread(ss.str() );
    if (im.empty())
    {
        std::cout<<"Cannot open source image!" << std::endl;
        return EXIT_FAILURE;
    }
    resize(im);

    cv::Mat gray;
    cv::cvtColor(im, gray, CV_BGR2GRAY);

    // Pass it to Tesseract API
    tesseract::TessBaseAPI tess;
    tess.Init(NULL, "eng", tesseract::OEM_DEFAULT);
    tess.SetPageSegMode(tesseract::PSM_SINGLE_BLOCK);
    tess.SetVariable("tessedit_char_whitelist", "QWERTYUIOPASDFGHJKLZXCVBNM");

    PIX *image = mat8ToPix(&im);

    //tess.SetImage((uchar*)gray.data, gray.cols, gray.rows, 1, gray.cols);
    tess.SetImage(image);

    // Get the text
    char* out = tess.GetUTF8Text();
    if(out != nullptr)
        std::cout << "here it is: "<< out << std::endl;

    cv::imshow("image", im);
    cv::imshow("gray", gray);
    cv::waitKey();

    return 0;
}

void resize(cv::Mat &img)
{
    while(img.size().width >= 500 && img.size().height >= 500 )
        cv::resize(img, img, cv::Size(img.size().width/2, img.size().height/2) );   
}

PIX *mat8ToPix(const cv::Mat *mat8)
{
    PIX *pixd = pixCreate(mat8->size().width, mat8->size().height, 8);
    for(int y=0; y<mat8->rows; y++) 
        for(int x=0; x<mat8->cols; x++) 
            pixSetPixel(pixd, x, y, (l_uint32) mat8->at<uchar>(y,x));

    return pixd;
}

cv::Mat pix8ToMat(PIX *pix8)
{
    cv::Mat mat(cv::Size(pix8->w, pix8->h), CV_8UC1);
    uint32_t *line = pix8->data;
    for (uint32_t y = 0; y < pix8->h; ++y) 
    {
        for (uint32_t x = 0; x < pix8->w; ++x) 
            mat.at<uchar>(y, x) = GET_DATA_BYTE(line, x);
        line += pix8->wpl;
    }
    return mat;
}

无论我处理什么图片,我都会在终端上得到:

$: Warning: Invalid resolution 0 dpi. Using 70 instead.



有人有解决办法吗?

提前致谢。

最佳答案

如果知道输入图像的分辨率,则可以在Leptonica Pix对象上调用pixSetResolution

或使用Tesseract API传递值。看到
Tess4j - Pdf to Tiff to tesseract - "Warning: Invalid resolution 0 dpi. Using 70 instead."

关于opencv - 警告:无效的分辨率0 dpi。改用70,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58343459/

相关文章:

javascript - python3 opencv 不保存可读视频

opencv - 将脸从非正面旋转到正面opencv

opencv - 在 OpenCV 中访问 IPL_DEPTH_16S 类型的 IplImage 元素

image-processing - 训练 tesseract 3 获取字母表

python - OCR 文件夹中的每个 .png 文件

ios - Swift 3 - 我使用哪种像素格式类型来获得最佳的 Tessecract 文本识别?

opencv - RANSAC相机校准实现

Android-视觉OCR;安卓视觉

c++ - Tesseract OCR 的置信度值

ios - 如何处理拍摄的图像然后使用 Swift 查看结果到 "text View"?