java - RSS 提要解析

标签 java parsing rss

我正在尝试从 new.google.com 检索 RSS 提要,我现在正在使用热门新闻提要:http://news.google.com/news?ned=us&topic=h&output=rss

我可以使用: http://pastebin.com/YDNPXyVK 正确检索和处理它

这是我得到的日志:http://pastebin.com/a5HRsatX ,似乎当有撇号时它就停止了......

感谢您为我提供的任何帮助。

最佳答案

您可能想使用 ROME 库。这是一个例子:

package com.infosys.hanumant.rome;

import java.net.URL;
import java.util.Iterator;

import com.sun.syndication.feed.synd.SyndEntry;
import com.sun.syndication.feed.synd.SyndFeed;
import com.sun.syndication.io.SyndFeedInput;
import com.sun.syndication.io.XmlReader;

/**
 * @author Hanumant Shikhare
 */
public class Reader {

  public static void main(String[] args) throws Exception {

    URL url  = new URL("http://example.com/feed.xml");
    XmlReader reader = null;

    try {
      reader = new XmlReader(url);
      SyndFeed feed = new SyndFeedInput().build(reader);
      System.out.println("Feed Title: "+ feed.getAuthor());

      for (Iterator i = feed.getEntries().iterator(); i.hasNext();) {
        SyndEntry entry = (SyndEntry) i.next();
        System.out.println(entry.getTitle());
      }
    } finally {
      if (reader != null)
        reader.close();
      }
    }
}

示例复制自 here .

关于java - RSS 提要解析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8611359/

相关文章:

JavaPreparedStatement,当batchExecute没有任何参数时会发生什么?

java - 在 SAX 解析器中解析大型 XML 文件时没有内存的异常

java - 拆分由 '[' 和 ']' 分隔的字符串

xml - 在 Rss 或 Atom-feeds 中使用 data-uri 嵌入图像

java.lang.OutOfMemoryError : Java heap space when doing a JDBC read from Oracle 错误

java - Apache Camel 中的 SEDA、VM 和 direct 有什么区别?

Java String TRIM 函数不起作用

PHP解析找不到 "span"标签

python - lxml - 难以解析 stackexchange rss 提要

xml - 在 Go 中解析 RSS feed