首先,我必须下载 tika-bundle-0.9.jar,但我找不到它。 其次,我写了这些
try {
URL itemURL = new URL("");
DataInputStream daHTMLfromDaItem = new DataInputStream(itemURL.openStream());
Tika tika = new Tika();
Metadata metadata = new Metadata();
Reader reader = tika.parse(daHTMLfromDaItem, metadata);
String s=reader.toString();
//System.out.print(s);
} catch (Exception e) {
e.printStackTrace();
}
错误
Error(5,24): cannot access class org.apache.tika.Tika; class file has wrong version 49.0, should be 45.3 or 46.0 or 47.0 or 48.0
Error(6,33): cannot access class org.apache.tika.metadata.Metadata; class file has wrong version 49.0, should be 45.3 or 46.0 or 47.0 or 48.0
Error(15,13): class Tika not found in class mypackage.TikaParsing
Error(15,29): class Tika not found in class mypackage.TikaParsing
Error(16,13): class Metadata not found in class mypackage.TikaParsing
Error(16,37): class Metadata not found in class mypackage.TikaParsing
另外,我不得不说我添加了除 tika-bundle-0.9.jar 之外的所有必需库。是否因为 tika-bundle-0.9.jar 而出现一些问题?我如何找到 tika-bundle-0.9.jar?我找不到解决方案。
谢谢
最佳答案
tika 库已使用 Java 1.5 编译,但您尝试在 Java 1.4 环境中运行它们。这就是第一条错误消息告诉我们的内容。版本 49.0
由 Java 1.5 生成,版本 48.0
由 Java 1.4.x
使用 Java 1.5+ 运行您的应用程序,或者尝试查找与 Java 1.4.2 兼容的旧版本 tika
关于java - 为了将 html 解析为字符串,我使用了 tika 解析器,但我遇到了一些问题,例如 jdeveloper 中的库和错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5469118/