java - 无法找到绝对网址

我正在编写一些代码来查找单个网页的绝对 URL:

http://explore.bfi.org.uk/4ce2b69ea7ef3

到目前为止，我获得了该页面的所有链接并打印了绝对 url

部分代码如下:

 Elements hyperLinks = htmlDoc.select("a[href]");

    for(Element link: hyperLinks)
    {
        System.out.println(link.attr("abs:href"));
    }

这会像上面那样打印出很多或 url。但是，它似乎也跳过了一些 URLS。它跳过的是我真正需要的。

这是 a[href] 元素之一，它没有变成绝对 URL:

<div class="title"><a href="/4ce2b69ea7ef3">Royal Review</a><br /></div>

如果我只打印“链接”，它会打印这一行，但当我输入“abs:href”时，它只会打印空白。

我是 Java 的新手，非常感谢任何反馈!

最佳答案

您不应该使用“a[href]”，而是在this example 之后使用“a” :

Document doc = Jsoup.connect("http://jsoup.org").get();

Element link = doc.select("a").first();
String relHref = link.attr("href"); // == "/"
String absHref = link.attr("abs:href"); // "http://jsoup.org/"

所以在你的情况下:

Elements hyperLinks = htmlDoc.select("a");

    for(Element link: hyperLinks)
    {
        System.out.println(link.attr("abs:href"));
    }

关于java - 无法找到绝对网址，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/19766486/

上一篇：javascript - 居中元素

下一篇：html - CSS:元素在 float div 上溢出

相关文章：

java - 将数组哈希为整数

html - 我怎样才能改变我的列表框的对齐方式

javascript - 如何将标记放置在图像顶部，并根据图像给出标记的位置？

java - 如何从 ArrayList.subList 获取一个 ArrayList？

java - JRE 是否(或将会)包含 CLI 解析器

java - 无法找到或加载主类 com.sun.tools.javac.Main hadoop mapreduce

php - 如何通过带有嵌套集模型的 php <ul> <li> 标签自动创建菜单

html - 需要div占空间布局，不会占空间

javascript - 在 div 中翻转动画不隐藏 Canvas 。预期行为是隐藏 Canvas

javascript - 单击 1 个按钮时同时加载 2 个不同 div 中的 2 个页面