我试图跳过未使用 feedparser 和 etags 修改的 RSS 提要。 遵循文档指南:http://pythonhosted.org/feedparser/http-etag.html
import feedparser
d = feedparser.parse('http://www.wired.com/wiredscience/feed/')
d2 = feedparser.parse('http://www.wired.com/wiredscience/feed/', etag=d.etag)
print d2.status
这个输出:
200
这个脚本不应该返回 304 吗? 我的理解是,当 RSS 提要更新时,etag 会发生变化,如果它们匹配,那么我应该得到 304。
为什么我没有得到预期的结果?
最佳答案
显然,此服务器配置为检查“If-Modified-Since” header 。您还需要传递上次修改时间:
>>> d = feedparser.parse('http://www.wired.com/wiredscience/feed/')
>>> feedparser.parse('http://www.wired.com/wiredscience/feed/',
etag=d.etag, modified=d.modified).status
304
>>> feedparser.parse('http://www.wired.com/wiredscience/feed/',
etag=d.etag).status
200
关于Python:如何使用 feedparser 和 etags 检查 RSS 更新,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16745083/