java - 什么是最好的 java html 解析器?

标签 java html parsing

<分区>

假设我们必须使用 java,最好的 html 解析器是什么,它可以灵活地解析许多不同的 html 内容,并且不需要大量代码来进行复杂类型的解析?

最佳答案

我会推荐 Jsoup为了这。它有一个非常好的 API,支持 jQuery like CSS selectors and non-verbose element iteration .复制this answer例如,这会在此处打印您自己的问题和所有回答者的姓名:

URL url = new URL("https://stackoverflow.com/questions/3121136");
Document document = Jsoup.parse(url, 3000);

String question = document.select("#question .post-text").text();
System.out.println("Question: " + question);

Elements answerers = document.select("#answers .user-details a");
for (Element answerer : answerers) {
    System.out.println("Answerer: " + answerer.text());
}

另一种选择是 XPath , 但 JSoup 对于已经很好地掌握 CSS 选择器的网络开发人员更有用。

关于java - 什么是最好的 java html 解析器?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3121136/

相关文章:

java - 如何获取应用程序的大小

javascript - 尝试更改子 div 属性时出错

python - django 使用原始 mysql 进行搜索

python - 使用python解析C代码

java - ANTLR:找不到符号

html - 对 perl HTML 解析有一点帮助

java - 在 sbt 中强制执行 Scala 项目的 Java 版本?

java - 远程服务器应该使用哪些java技术?

java - Birt 中的日期参数验证

html - [ Shiny ] : Add link to another tabPanel in another tabPanel