我的 Python 版本是 2.7,在 Ubuntu 机器上运行。我正在尝试使用请求通过代理服务器获取某些页面,它不适用于具有完整路径的网址。这是一个显示此问题的示例,
In [30]: proxies
Out[30]: {'http': 'http://webproxyserver.info:80'}
In [31]: url = 'http://api.mongodb.org/'
In [32]: r = requests.get(url,proxies = proxies)
In [33]: r.status_code
Out[33]: 200
In [34]: url_1 = 'http://api.mongodb.org/python'
In [35]: r = requests.get(url_1,proxies = proxies)
In [36]: r.status_code
Out[36]: 404
不知道是不是代理的问题?或者我的 Python 代码有问题。它看起来像主域的代理唯一词(没有任何路径)。
感谢您提供任何信息。
--- 更新于 05/11 我刚刚意识到代理服务器根本不起作用。我从 proxy4free 获得了代理服务器,看起来它们不是真正的代理服务器,它们是一些像浏览器一样工作的网站。
我试过另一个真正的代理服务器,代码执行起来都很好。感谢您提供所有信息。
最佳答案
看起来代理服务器有问题,我认为它无法处理 http://api.mongodb.org/python
抛出的 302
/p>
$export http_proxy=
$curl -s -w '%{http_code}\n' 'http://api.mongodb.org/' -o /dev/null
200
$curl -s -w '%{http_code}\n' 'http://api.mongodb.org/python' -o /dev/null
302
$export http_proxy='http://webproxyserver.info:80'
$curl -s -w '%{http_code}\n' 'http://api.mongodb.org/' -o /dev/null
200
$curl -s -w '%{http_code}\n' 'http://api.mongodb.org/python' -o /dev/null
404
关于Python 请求模块不适用于带路径的 url,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33505224/