java - 从 JPG 中提取文本

标签 java image text apache-poi extract

我已经尝试了这段代码并添加了所需的 jar 文件,但仍然收到一条错误消息,例如线程“main”java.lang.UnsatisfiedLinkError中的异常:无法加载库“libtesseract302”。

是否有完整的教程如何提取文本以及应该采取哪些措施来解决错误?如有任何帮助,我们将不胜感激...

import net.sourceforge.tess4j.*;
import java.io.File;

public class ExtractTxtFromImg {
    public static void main(String[] args) {
        File imgFile = new File("C:\\Documents and Settings\\rueca\\Desktop\\sampleImg.jpg");
        Tesseract instance = Tesseract.getInstance();  // JNA Interface Mapping
        // Tesseract1 instance = new Tesseract1(); // JNA Direct Mapping

        try {
            String result = instance.doOCR(imgFile);
            System.out.println(result);
        } catch (Exception e) {
            System.err.println(e.getMessage());
        }
    }
}

最佳答案

除了添加 jar 之外,您还需要添加 native 。您可以使用 Djava.library.path="C:\[包含 *.dll 文件等的目录的绝对路径]"

请注意,您需要提供目录,而不是文件本身。

关于java - 从 JPG 中提取文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23484233/

相关文章:

javascript - 带动画过渡的整页图像

java - 如何使用 RegExp 替换除双引号之外的所有标点符号

java - Android下载管理器下载位置

java - Applet 可以打开新的 HTML 窗口*并*绕过弹出窗口阻止程序吗?

c++ - 从文件中读取带空格的字符串

text - 如何在 SwiftUI 文本中使用自定义字体使我的文本加粗?

c - 为什么我的字数不正确?

java - 如何动态地在整数数组中添加元素?

html - 响应图像 - 宽度差异 : 100%/width:auto

IOS:将数据存储到文本文件中