Java使用JSOUP从HTML源代码获取RSS链接

标签 java rss jsoup html-parser

我正在尝试从 html 源代码获取 RSS 链接。我用过Jsoup java 库来查找 rss 链接。我写了一小段代码来获取 RSS 链接,但不幸的是它并不适用于所有网站。下面是我的代码

String url = "http://www.smashingmagazine.com/"; // not working
Document doc = Jsoup.connect(url).get();
Elements links = doc.select("link[type=application/rss+xml]");

if (links.size() > 0) {
    String rss_url = links.get(0).attr("href").toString();
} else {
    // RSS url not found
}

上述代码并不适用于所有网站。请解决我的问题。 (我正在尝试查找 RSS 2.0 链接)

谢谢

最佳答案

答案是:

String url = "http://www.smashingmagazine.com/"; // not working
Document doc = Jsoup.connect(url).get();

Elements links = doc.select("link[type=application/rss+xml]");

if (links.size() > 0) {
    String rss_url = links.get(0).attr("abs:href").toString();
} else {....
    // RSS url not found
}

希望您一切顺利。 它适用于 .attr(*"abs:*href")

二图

关于Java使用JSOUP从HTML源代码获取RSS链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10772271/

相关文章:

java - 在表中插入数组列表的各个值

java - 避免对大型数据集使用收集

java - 有没有什么方法可以使用 Java 来查找给定的 URL 是 RSS feed 还是 Atom?

java - 使用白名单清理 html 并在白名单元素上保留一些属性

java - 我保存到磁盘的内联附件已损坏

java - 从 datasource.getConnection() 获取 OracleConnection

PHP 创建 RSS-feed,而不是更新

javascript - document.evaluate 不适用于 RSS 提要页面

java - 在 JSoup 中选择 "name"

android - 获取第一个元素时奇怪的 jsoup 行为