我正在尝试使用 Beautifulsoup 解析 RSS/Podcast 提要并且一切正常,除了我似乎无法解析“pubDate”字段。
data = urllib2.urlopen("http://www.democracynow.org/podcast.xml")
dom = BeautifulStoneSoup(data, fromEncoding='utf-8')
items = dom.findAll('item');
for item in items:
title = item.find('title').string.strip()
pubDate = item.find('pubDate').string.strip()
标题得到了很好的解析,但是当它到达 pubDate 时,它说:
追溯(最近的调用最后): 文件“”,第 2 行,位于 AttributeError: 'NoneType' 对象没有属性 'string'
但是,当我下载 XML 文件的副本并将“pubDate”重命名为其他名称,然后再次解析它时,它似乎起作用了。 pubDate 是 Python 中的保留变量还是什么?
谢谢,
克
最佳答案
它适用于 item.find('pubdate').string.strip()
。
你为什么不使用 feedparser ?
关于python - pubDate RSS 使用 Beautifulsoup/Python 解析怪异,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2168516/