python - pubDate RSS 使用 Beautifulsoup/Python 解析怪异

我正在尝试使用 Beautifulsoup 解析 RSS/Podcast 提要并且一切正常，除了我似乎无法解析“pubDate”字段。

data = urllib2.urlopen("http://www.democracynow.org/podcast.xml")
dom = BeautifulStoneSoup(data, fromEncoding='utf-8')
items = dom.findAll('item');

for item in items:
    title = item.find('title').string.strip()
    pubDate = item.find('pubDate').string.strip()

标题得到了很好的解析，但是当它到达 pubDate 时，它说:

追溯(最近的调用最后): 文件“”，第 2 行，位于 AttributeError: 'NoneType' 对象没有属性 'string'

但是，当我下载 XML 文件的副本并将“pubDate”重命名为其他名称，然后再次解析它时，它似乎起作用了。 pubDate 是 Python 中的保留变量还是什么？

谢谢，

克

最佳答案

它适用于 item.find('pubdate').string.strip()。你为什么不使用 feedparser ？

关于python - pubDate RSS 使用 Beautifulsoup/Python 解析怪异，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/2168516/