我需要用 Python 创建软件,用于在发生更改时监控网站。目前我有定期任务并检查网站内容与以前的版本。有没有更简单的方法来检查网站内容是否已更改,也许是上次更改的时间,以避免每次都下载内容?
最佳答案
在实际下载完整内容之前,您可以使用 HEAD
HTTP 方法并查看 Date-Modified
和 ETag
header 等再次。
然而,当实体(URL)的内容发生变化时,没有任何东西可以保证服务器实际更新这些 header ,或者甚至可以正确响应 HEAD
方法。
关于python - 获取网站上的最后更改,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9738522/