使用 Java 将网页的源代码存储在一个字符串中。我想提取源代码中的所有url并输出。我对正则表达式之类的东西很糟糕,甚至不知道如何处理这个问题。任何帮助将不胜感激。
最佳答案
Don't use regex .使用parser喜欢JSoup .
String html = "your html string";
Document document = Jsoup.parse(html); // Can also take an URL.
for (Element element : document.getElementsByTag("a")) {
System.out.println(element.attr("href"));
}
关于java - 使用 Java 在网页上查找链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2717760/