python - 如何使 python urllib2 遵循重定向并保留 post 方法

标签 python automation urllib2

我正在使用 urllib2 将数据发布到表单。问题是表单回复了 302 重定向。根据Python HTTPRedirectHandler重定向处理程序将接受请求并将其从 POST 转换为 GET 并遵循 301 或 302。我想保留 POST 方法和传递给 opener 的数据。我通过简单地将 data=req.get_data() 添加到新请求来尝试自定义 HTTPRedirectHandler,但没有成功。

我确信以前已经做过这样的事情,所以我想我应该发一篇文章。

注意:这类似于 this postthis one但我不想阻止重定向,我只想保留 POST 数据。

这是我的 HTTPRedirectHandler 不起作用

class MyHTTPRedirectHandler(urllib2.HTTPRedirectHandler):
def redirect_request(self, req, fp, code, msg, headers, newurl):
    """Return a Request or None in response to a redirect.

    This is called by the http_error_30x methods when a
    redirection response is received.  If a redirection should
    take place, return a new Request to allow http_error_30x to
    perform the redirect.  Otherwise, raise HTTPError if no-one
    else should try to handle this url.  Return None if you can't
    but another Handler might.
    """
    m = req.get_method()
    if (code in (301, 302, 303, 307) and m in ("GET", "HEAD")
        or code in (301, 302, 303) and m == "POST"):
        # Strictly (according to RFC 2616), 301 or 302 in response
        # to a POST MUST NOT cause a redirection without confirmation
        # from the user (of urllib2, in this case).  In practice,
        # essentially all clients do redirect in this case, so we
        # do the same.
        # be conciliant with URIs containing a space
        newurl = newurl.replace(' ', '%20')
        return Request(newurl,
                       headers=req.headers,
                       data=req.get_data(),
                       origin_req_host=req.get_origin_req_host(),
                       unverifiable=True)
    else:
        raise HTTPError(req.get_full_url(), code, msg, headers, fp)

最佳答案

我越想越觉得这实际上是一件非常糟糕的事情。例如,如果我向 http://example.com/add (使用发布数据来添加项目) 响应是 302 重定向到 http://example.com/add我发布了与第一次发布相同的数据,最终将陷入无限循环。不知道为什么我之前没有想到这一点。我将把这个问题留在这里,作为对其他考虑这样做的人的警告。

关于python - 如何使 python urllib2 遵循重定向并保留 post 方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1258428/

相关文章:

spring-mvc - 如何在资源有限的测试环境中重现 "Multiuser Concurrency Problems"

Python 网络抓取线程性能

python - Urllib 的 urlopen 在某些站点上中断(例如 StackApps api): returns garbage results

python - 检索数组中每个项目的元素

visual-studio-2010 - Autoit 不生成从列表中选择项目后调用的事件

python - 计算二维数组中出现的次数

windows - 自动启动 Windows 录音机

使用 Tor 作为代理时 Python urllib2 超时?

python - 无法在 Mininet 中设置 IP 地址

Python Mysql类调用存储过程