java - 在java中解析html以提取信息

标签 java html-parsing

如果您让我知道是否有一个java类可以根据XML从HTML页面中提取信息,我将不胜感激。

谢谢

最佳答案

您可以使用Jsoup 。我用这个,解析html非常好。 以下是 Jsoup 网站的示例:

示例 获取维基百科主页,将其解析为 DOM,然后从新闻部分中选择标题到元素列表中:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Elements newsHeadlines = doc.select("#mp-itn b a");

关于java - 在java中解析html以提取信息,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12435759/

相关文章:

python - 为什么用美汤解析这个标签是空的?

javascript - 如何使用 jquery 使用 name 属性解析远程页面中的图像?

java - 无法获取某种使用 jsoup 解析 HTML 页面的链接

java - Android ArrayList 的自定义对象问题

Java:创建自定义异常类 package.Exception

java - 如何在 AWS Elastic Beanstalk 上安装/运行 Spark Java 框架?

java - 如何重新启用已禁用的 JTextField?

macos - 如何使用XPath和Swift 2.0解析html?

python - BeautifulSoup 按数字指定表格列?

java - Android java跨域