python - 从 python 中的 feedparser 解析不同的日期格式?

标签 python datetime parsing rss feedparser

我正在尝试通过 feedparser 从两个不同的 RSS 提要中的条目获取日期.

这是我正在做的:

import feedparser as fp
reddit = fp.parse("http://www.reddit.com/.rss")
cc = fp.parse("http://contentconsumer.com/feed")
print reddit.entries[0].date
print cc.entries[0].date

结果如下:

2008-10-21T22:23:28.033841+00:00

Wed, 15 Oct 2008 10:06:10 +0000

我想达到可以轻松找出哪个更新的地步。

我已经尝试使用 Python 的 datetime 模块并搜索 feedparser 文档,但我无法解决这个问题。任何帮助将不胜感激。

最佳答案

在野外使用 RSS 提要时,日期解析是一件很痛苦的事情,而这正是 feedparser 可以提供很大帮助的地方。

如果您使用 *_parsed 属性(如 updated_pa​​rsed),feedparser 将完成工作并返回一个 9 元组 Python UTC 日期。

参见 http://packages.python.org/feedparser/date-parsing.html了解更多细节。

关于python - 从 python 中的 feedparser 解析不同的日期格式?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/225274/

相关文章:

python - 如何为本文构造正则表达式

c# - 在 MVC5 中指定日期格式 (dd/MM/yyyy)

android - 安卓手机上的第一个工作日

algorithm - 未转义的用户名是否与 BNF 不兼容?

java - 使用 DOM4J 解析 XML 文件

python 字符串比较 (==) 不工作

python - 使用 Selenium Webdriver 访问在 QT Webkit 之上运行的嵌入式设备 UI

python - 直方图在 pandas groupby 对象上无法正常工作

django - DateTimeInput 在 Django 中被呈现为简单的文本输入

parsing - Antlr 解析器运算符优先级