java - 从网站获取超链接

标签 java jsoup

我正在使用 Jsoup。 我执行 get document= connect.get(); 并获取 html 页面。

现在我将其写入文本(字符串)。

我有填充这些页面的用户。 我知道每个用户名。这些页面有用户名。 我可以执行 string.contains("username") 来检查用户是否存在。

现在我的问题是: 我有一些用户的名字是

表格

有序列表

无序列表

在正文

但在所有这些情况下,它们的格式如下:示例

<li><a href="http://university.xxx.students.com/grade9/john/117429">2012 academic record</a></li>

一些在表中,全部..

在示例中,我知道学生姓名 = john。 我怎样才能获得所有的网址?

==

最佳答案

您可以使用正则表达式:

Elements elements = document.select("[href~=(?is)http://university\\.xxx\\.students\\.com/grade9/(.+?)/[0 -9]+?]")

更抽象:document.select("a[href~=regex]")

如果您已经知道名称,可以替换(.+?),例如:

Elements elements = document.select("[href~=(?is)http://university\\.xxx\\.students\\.com/grade9/"+ name + "/[0 -9]+?]")

关于java - 从网站获取超链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12275109/

相关文章:

java - 调整大小功能时遇到问题

java - 如何在不创建JSOUP文档的情况下处理图像标签

java - 使用 jsoup java 从文本中检索 HTML 结构

java - Java 应用程序中的 Microsoft Translator API

java - 为什么 Netbeans "Initialization hint"说对 zapOperatorBooleans() 的调用是对构造函数的有问题的调用?

java - 在 For 循环中从 LinkedList 中删除元素;备择方案?

java - jsoup 请求返回错误的状态代码

java - 从sup标签中检索文本

java - 为什么 ActionListener 不起作用?

java - 从另一个线程调用adapter.notifyDataSetChanged()