java - 使用 jsoup 从表中提取内容

标签 java jsoup

我正在尝试解析以下页面。

Document doc = Jsoup.connect(“http://www.informatik.unitrier.de/~ley/pers/hd/h/Han:Jiawei.html“).get();

我需要提取第一个表的内容,即只有作者姓名及其出版物。但我只需要从 1986 年到 2012 年的表内容。 jsoup 中可能的语法是什么?

任何帮助将不胜感激。

最佳答案

该网站的数据使用javascript,因此无法使用jsoup对其进行解析。

我在此答案中列出了一些替代方案:Trying to parse html hidden by javascript

关于java - 使用 jsoup 从表中提取内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15572321/

相关文章:

java - 应该使用哪种设计模式?

java - 将数据从复杂的 HTML 表中提取到 Java 中的二维数组

Java Jsoup按钮选择

java - 如何替换元素?

java - 使用 JSoup 抓取 Google 天气结果

java - 获取 JavaScript 创建的链接的内容

java - Spring移动重定向404错误

java - 如何使用 portainer 名称作为主机名连接到 mongodb?

java - 如何在 IntelliJ IDE 中将 Spark 与 Scala 项目集成?

java - Spring Beans 中的 EJB 3 Sessioncontext