我在我的网站上创建了一个页面 http://shedez.com/test.html此页面将用户重定向到我服务器上的 jpg
我想使用 python 脚本将此图像复制到我的本地驱动器。我希望 python 脚本先转到主 url,然后再转到图片的目标 url
然后复制图像。截至目前,目标 url 是硬编码的,但在未来它将是动态的,因为我将使用地理编码通过 ip 查找城市,然后将我的用户重定向到他们所在城市的当天照片。
== 我现在的脚本 ===
import urllib2, os
req = urllib2.urlopen("http://shedez.com/test.html")
final_link = req.info()
print req.info()
def get_image(remote, local):
imgData = urllib2.urlopen(final_link).read()
output = open(local,'wb')
output.write(imgData)
output.close()
return local
fn = os.path.join(self.tmp, 'bells.jpg')
firstimg = get_image(final_link, fn)
最佳答案
好像不是header重定向。这是 url 的主体 -
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">\n<html>\n<head>\n<title>Your Page Title</title>\n<meta http-equiv="REFRESH" content="0;url=htt
p://2.bp.blogspot.com/-hF8PH92aYT0/TnBxwuDdcwI/AAAAAAAAHMo/71umGutZhBY/s1600/Professional%2BBusiness%2BCard%2BDesign%2B1.jpg"></HEAD>\n<BODY>\nOptional page t
ext here.\n</BODY>\n</HTML>
您可以使用 urllib
或 requests
轻松获取内容,并使用 BeautifulSoup
或 lxml
解析 HTML 以从 meta
标签获取图片 url。
关于python - 如何在 python 中捕获重定向的 url,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15564523/