java - 使用 Java 在网页上查找链接

标签 java regex hyperlink

使用 Java 将网页的源代码存储在一个字符串中。我想提取源代码中的所有url并输出。我对正则表达式之类的东西很糟糕,甚至不知道如何处理这个问题。任何帮助将不胜感激。

最佳答案

Don't use regex .使用parser喜欢JSoup .

String html = "your html string";
Document document = Jsoup.parse(html); // Can also take an URL.
for (Element element : document.getElementsByTag("a")) {
    System.out.println(element.attr("href"));
}

关于java - 使用 Java 在网页上查找链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2717760/

相关文章:

java - 切换 JCheckBox 值

php - 需要防止 PHP 正则表达式段错误

javascript - Three.js 演示中无法通过触摸选择超链接

css - 我的原始按钮不会显示,但我的悬停会显示吗?

html - 链接 2 行文本和图像

java - StringPool中的字符串对象生命周期

java - XMLBeans get_store() 方法返回 null

java - 'Static' 关键字有什么作用?

javascript - 用于匹配\sSTUFF\r 中内容的正则表达式

java - 如何使用正则表达式替换 java 中的标记?