我已经尝试了这段代码并添加了所需的 jar 文件,但仍然收到一条错误消息,例如线程“main”java.lang.UnsatisfiedLinkError中的异常:无法加载库“libtesseract302”。
是否有完整的教程如何提取文本以及应该采取哪些措施来解决错误?如有任何帮助,我们将不胜感激...
import net.sourceforge.tess4j.*;
import java.io.File;
public class ExtractTxtFromImg {
public static void main(String[] args) {
File imgFile = new File("C:\\Documents and Settings\\rueca\\Desktop\\sampleImg.jpg");
Tesseract instance = Tesseract.getInstance(); // JNA Interface Mapping
// Tesseract1 instance = new Tesseract1(); // JNA Direct Mapping
try {
String result = instance.doOCR(imgFile);
System.out.println(result);
} catch (Exception e) {
System.err.println(e.getMessage());
}
}
}
最佳答案
除了添加 jar 之外,您还需要添加 native 。您可以使用 Djava.library.path="C:\[包含 *.dll 文件等的目录的绝对路径]"
请注意,您需要提供目录,而不是文件本身。
关于java - 从 JPG 中提取文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23484233/