java - 如何使用 Jsoup 提取书籍的作者?

标签 java web-scraping jsoup

我正在尝试使用 Jsoup 提取此 Amazon 页面上书籍的作者:Link

enter image description here

我已经能够刮掉标题了:

public static final String URL_LITERATURE_FICTION="https://www.amazon.com/b/ref=s9_acss_bw_en_BGG15eve_d_1_6_w?_encoding=UTF8&node=17&pf_rd_m=ATVPDKIKX0DER&pf_rd_s=merchandised-search-top-3&pf_rd_r=8Z2ERCN30FREH3ZD6AHC&pf_rd_r=8Z2ERCN30FREH3ZD6AHC&pf_rd_t=101&pf_rd_p=c0b03f4d-c947-45e3-9b66-2bd220509181&pf_rd_p=c0b03f4d-c947-45e3-9b66-2bd220509181&pf_rd_i=283155";
Document doc = Jsoup.connect(URL_LITERATURE_FICTION).userAgent("Mozilla").get();
Elements link = doc.select(".s-result-list-parent-container > ul > li .s-access-title");

但我不知道如何提取作者。有任何想法吗? 提前致谢。

最佳答案

根据您在问题中提供的链接,满足您的抓取需求的有效 DOM 选择器是:

.a-fixed-left-grid .a-fixed-left-grid-inner .a-row.a-spacing-none .a-size-small.a-color-secondary .a-link-normal.a-text-normal

关于java - 如何使用 Jsoup 提取书籍的作者?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47677073/

相关文章:

java - Spring (Java) - 注册和列表

python - 抓取网络传单

python - 如何将 Google Chrome 扩展与 Selenium 结合使用?

ruby - 访问 div 元素数组中的 div 元素的属性

html - 如何区分具有相同标记名和相同文本的两个 HTML 元素

java - jsoup 中标签内的数据丢失

java - 我将如何使用 JSoup 在 JEditorPane 或类似的上显示文档

java - Hibernate sessionfactory 不识别标识符

java - 如何在 Android 上使用 HTTPS 对服务器进行 POST 调用

java - net.ucanaccess.jdbc.UcanaccessSQLException 游标状态无效