我正在尝试解析以下页面。
Document doc = Jsoup.connect(“http://www.informatik.unitrier.de/~ley/pers/hd/h/Han:Jiawei.html“).get();
我需要提取第一个表的内容,即只有作者姓名及其出版物。但我只需要从 1986 年到 2012 年的表内容。 jsoup 中可能的语法是什么?
任何帮助将不胜感激。
最佳答案
该网站的数据使用javascript,因此无法使用jsoup对其进行解析。
我在此答案中列出了一些替代方案:Trying to parse html hidden by javascript
关于java - 使用 jsoup 从表中提取内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15572321/