java - 使用 JSOUP 从另一个网站获取数据

基本上，我需要一张 table ，里面有所有可能存在的书籍，但我不想这样做，因为我是一个非常懒的人 xD。所以，我的问题是..我可以使用一个我想到的网站，就像切断这个网站的其余部分(我不需要)并只留下搜索部分(也许可以做一些改变)布局)...然后，进行搜索，找到这本书并仅将对我有意义的数据存储在我的数据库中。那可能吗？我听说 JSOUP 可以提供帮助。所以，我只想要一些提示。 (感谢阅读)。

网站:http://www.isbn.bn.br/website/consulta/cadastro

最佳答案

是的，您可以使用 Jsoup 来做到这一点，主要问题是您共享的 URL 使用 JavaScript，因此您需要使用 Selenium 来强制 JS 执行，或者您也可以获取图书 URL 并解析它。

使用Jsoup解析网页的方法是:

Document document = Jsoup.connect("YOUR-URL-GOES-HERE")
                         .userAgent("Mozilla/5.0")
                         .get();

您检索文档中的整个 HTML，以便您可以使用 CSS 选择器获取该元素中包含的任何元素，例如，如果您想在 HTML 中检索网页的标题，您可以使用:

Elements elements = document.select("title");

对于您想要从中检索信息的每个 HTML 标记。您可以查看 Jsoup 文档并检查一些解释的示例:Jsoup

希望对你有帮助!

关于java - 使用 JSOUP 从另一个网站获取数据，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/52981323/

java - 使用 JSOUP 从另一个网站获取数据

上一篇：java - Spring引导-设置PERL5LIB

下一篇：java - 给定两个列表，查找字符串中子字符串的出现次数