java - 在java中解析html以提取信息

如果您让我知道是否有一个java类可以根据XML从HTML页面中提取信息，我将不胜感激。

谢谢

最佳答案

您可以使用Jsoup 。我用这个，解析html非常好。以下是 Jsoup 网站的示例:

示例获取维基百科主页，将其解析为 DOM，然后从新闻部分中选择标题到元素列表中:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Elements newsHeadlines = doc.select("#mp-itn b a");

关于java - 在java中解析html以提取信息，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/12435759/

相关文章：

java文件复制不包括已经复制的文件