python - 在 Python 中确定重定向的 URL

标签 python parsing redirect

我使用 HTMLparser 做了一个小解析器,我想知道链接被重定向到哪里。我不知道如何解释这个,所以请看这个例子:

在我的页面上,我有一个源链接:http://www.myweb.com?out=147,重定向到 http://www.mylink.com 。我可以毫无问题地解析 http://www.myweb.com?out=147,但我不知道如何获取 http://www.mylink.com.

最佳答案

您可以使用 urllib2 (Python 3 中的 urllib.request)及其 HTTPRedirectHandler为了找出 URL 会将您重定向到哪里。这是执行此操作的函数:

import urllib2

def get_redirected_url(url):
    opener = urllib2.build_opener(urllib2.HTTPRedirectHandler)
    request = opener.open(url)
    return request.url

print get_redirected_url("http://google.com/")
# prints "http://www.google.com/"

关于python - 在 Python 中确定重定向的 URL,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5538280/

相关文章:

Python:通过xpath获取html表格数据

python - 获取区域包围的第一个和最后一个值的索引

python - 为什么 pytest 中的列表与控制台的输出不同?

c - 在不求助于 GLR-Parser 的情况下解决模棱两可的语法

linux - 有没有办法将 "echoing"到标准输出,将什么作为标准输入重定向到程序(Unix)?

python - 将 wlst 命令重定向到 python 脚本中的文件

.htaccess - .htaccess 中用于匹配关键字的 RewriteRule 规则

python - 从表中选择数据在 SQLAlchemy 中抛出错误

python - 如何在 Django ORM 中连接两个表而没有第一个表中的任何列引用第二个

javascript - JSON.parse 转义以防止 XSS 以及将任何字符插入到来自 WebSockets 的 html、属性和值中