java - 使用 JSOUP 从另一个网站获取数据

标签 java jsoup

基本上,我需要一张 table ,里面有所有可能存在的书籍,但我不想这样做,因为我是一个非常懒的人 xD。所以,我的问题是..我可以使用一个我想到的网站,就像切断这个网站的其余部分(我不需要)并只留下搜索部分(也许可以做一些改变)布局)...然后,进行搜索,找到这本书并仅将对我有意义的数据存储在我的数据库中。那可能吗?我听说 JSOUP 可以提供帮助。 所以,我只想要一些提示。 (感谢阅读)。

网站:http://www.isbn.bn.br/website/consulta/cadastro

最佳答案

是的,您可以使用 Jsoup 来做到这一点,主要问题是您共享的 URL 使用 JavaScript,因此您需要使用 Selenium 来强制 JS 执行,或者您也可以获取图书 URL 并解析它。

使用Jsoup解析网页的方法是:

Document document = Jsoup.connect("YOUR-URL-GOES-HERE")
                         .userAgent("Mozilla/5.0")
                         .get();

您检索文档中的整个 HTML,以便您可以使用 CSS 选择器获取该元素中包含的任何元素,例如,如果您想在 HTML 中检索网页的标题,您可以使用:

Elements elements = document.select("title");

对于您想要从中检索信息的每个 HTML 标记。您可以查看 Jsoup 文档并检查一些解释的示例:Jsoup

希望对你有帮助!

关于java - 使用 JSOUP 从另一个网站获取数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52981323/

相关文章:

Java:在二维数组中存储值

java - 使用Jsoup时如何获取元素的LineNumber?

html - 解析/提取 HTML 表格,Java 网站

android - 使用 JSoup 解析 NullPointerException

javascript - 如何从 Java 调用 Nashorns `ScriptFunction` 回调?

java - 天空盒是全黑的

java - 具有多个 where 条件的右外连接

Android ListView 项目点击不会转到正确的屏幕

java - Jsoup:用文本更改标签然后保存在 Java 中

java - 在构建我的应用程序 jar 时包括外部 jar