java - 从具有属性的 JSoup <a> 标记中提取链接

标签 java html jsoup

在 HTML 文档中我有以下标签

<a id="myUniqueID" class="myClassName" href="/uniqueURLToExtract" data-original-title"">This is a Title</a>

我正在使用 JSoup 并想提取包含在 href 中的 URL由 myUniqueID 识别.在阅读了关于 SO 的以下主题之后

  1. Jsoup - extracting data from an <a> tag, inside a <td> tag

  2. JSoup parsing data from within a tag

我想到了这段代码

...
document = Jsoup.connect(mySiteAddress).timeout(10*1000).get();
...
String URLStr = document.select(a[id=myUniqueID]").text();

但这只是打印

This is a Title

我尝试过其他变体,但都没有成功。我要么没有打印任何内容,要么以空指针异常结束。

我不确定如何提取由 ID myUniqueID 标识的 URL在<a>标签。

最佳答案

尝试:

String URLStr = document.select("a[id=myUniqueID]").attr("href");

所以 attr() 优于 text()

关于java - 从具有属性的 JSoup <a> 标记中提取链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29568699/

相关文章:

android - 使用 JSOUP 解析 HTML 表格并将其显示到 ListView

java - 我如何获得学生成绩计算器程序中类似成绩字母的总数

java - 如何将变量从javascript传递到另一个jsp页面?

html - 如何使用 Mailto URL 发送带有主题的邮件?

java - JSOUP 未解析的编译 : ignoreHttpErrors() is undefined for the type Connection

selenium - 如何将 Jsoup 与 WebDriver 集成?

java - 使用 g.drawString 显示新行

java - 为什么 Spring 在第一次调用 Repository 方法后关闭 Runnable 中的 DB-session?

javascript - 如何使用 JS 根据鼠标位置移动图像?

html - 数据与原始容器重叠