java - 为了将 html 解析为字符串,我使用了 tika 解析器,但我遇到了一些问题,例如 jdeveloper 中的库和错误

标签 java html apache apache-tika

首先,我必须下载 tika-bundle-0.9.jar,但我找不到它。 其次,我写了这些

 try {
        URL itemURL = new URL("");
        DataInputStream daHTMLfromDaItem = new DataInputStream(itemURL.openStream());
        Tika tika = new Tika();
        Metadata metadata = new Metadata();
        Reader reader = tika.parse(daHTMLfromDaItem, metadata);

          String s=reader.toString();
          //System.out.print(s);


    } catch (Exception e) {
        e.printStackTrace();
    }

错误

Error(5,24): cannot access class org.apache.tika.Tika; class file has wrong version 49.0, should be 45.3 or 46.0 or 47.0 or 48.0

Error(6,33): cannot access class org.apache.tika.metadata.Metadata; class file has wrong version 49.0, should be 45.3 or 46.0 or 47.0 or 48.0

Error(15,13): class Tika not found in class mypackage.TikaParsing

Error(15,29): class Tika not found in class mypackage.TikaParsing

Error(16,13): class Metadata not found in class mypackage.TikaParsing

Error(16,37): class Metadata not found in class mypackage.TikaParsing

另外,我不得不说我添加了除 tika-bundle-0.9.jar 之外的所有必需库。是否因为 tika-bundle-0.9.jar 而出现一些问题?我如何找到 tika-bundle-0.9.jar?我找不到解决方案。

谢谢

最佳答案

tika 库已使用 Java 1.5 编译,但您尝试在 Java 1.4 环境中运行它们。这就是第一条错误消息告诉我们的内容。版本 49.0 由 Java 1.5 生成,版本 48.0 由 Java 1.4.x

使用 Java 1.5+ 运行您的应用程序,或者尝试查找与 Java 1.4.2 兼容的旧版本 tika

关于java - 为了将 html 解析为字符串,我使用了 tika 解析器,但我遇到了一些问题,例如 jdeveloper 中的库和错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5469118/

相关文章:

javascript - 如何折叠/展开本网站上的 DIV

Apache - 使用 .htaccess 将图像重写为 php 文件

python - Django/Apache/Mod_WSGI - 静态文件的 HTTP 404 错误

php - 当 HTTP 连接终止时,由 apache 执行的 PHP 脚本是否被终止?

java - 如何在 Jetty 8 中添加请求日志过滤器?

java - 从java中的arrayList打印数组

java - 构造函数如何在继承自父 java 类的 TestNG 类中工作

html - 使用 apache 注入(inject) html

java - Java 数组如何无法通过索引访问?

html - 是否有 CTRL + SHIFT + F 用于 sublime 之类的 eclipse 快捷方式?