java - 在java中解析html以提取信息

标签 java html-parsing

如果您让我知道是否有一个java类可以根据XML从HTML页面中提取信息,我将不胜感激。

谢谢

最佳答案

您可以使用Jsoup 。我用这个,解析html非常好。 以下是 Jsoup 网站的示例:

示例 获取维基百科主页,将其解析为 DOM,然后从新闻部分中选择标题到元素列表中:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Elements newsHeadlines = doc.select("#mp-itn b a");

关于java - 在java中解析html以提取信息,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12435759/

相关文章:

java文件复制不包括已经复制的文件

java - TestNG 监听器的顺序 (java Webdriver)

python - 从 HTML 中选取图像 URL

python - 在 BeautifulSoup 中打印最后一个 <td>

c# - 从 html 字符串中提取数据的库

java - 如何在 websocket open 方法中获取当前用户的 id?

java - 无法安装 python javabridge

java - 当某些模块未编译时如何在 IntelliJ 中运行单元测试?

java - 为什么我只能获取网站首页的HTML,而不能获取其他网站的HTML?

c# - HtmlAgilityPack 设置节点 InnerText