我有一个 url 列表,但其中许多已经过时,它们会重定向到他们的主页或他们域中的其他页面。我想从我的列表中过滤掉这些网址。使用 requests
,如何过滤掉未在预期位置打开的 url?
最佳答案
你应该检查 response history . 注意:并非所有网站都使用重定向来向您显示另一个页面。
>>> r = requests.head('http://github.com', allow_redirects=True)
>>> r.url
'https://github.com/'
>>> r.history
[<Response [301]>]
您还可以阻止重定向并检查响应 status_code
是否指示,参见 this example :
>>> r = requests.get('http://github.com', allow_redirects=False)
>>> r.status_code
301
>>> r.history
[]
关于python:如何判断一个链接是否重定向到另一个链接?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27495252/