python - 我们可以使用 urllib 或 urllib2 或 requests 或 mechanize 在 python 中重新加载页面/url 吗?

标签 python python-requests urllib2 mechanize urllib

我正在尝试打开一个页面/链接并捕获其中的内容。 它有时会给我所需的内容,有时会引发错误。 我发现如果我刷新页面几次 - 我就会得到内容。

所以,我想重新加载页面并捕获它。

这是我的伪代码:

attempts = 0
while attempts:
    try:
        open_page = urllib2.Request(www.xyz.com)
        # Or I think we can also do urllib2.urlopen(www.xyz.com)
        break
    except: 
        # here I want to refresh/reload the page
        attempts += 1


我的问题是:
1. 如何使用 urllib 或 urllib2 或 requests 或 mechanize 重新加载页面?
2.我们可以这样循环try catch吗?

谢谢!

最佳答案

import requests
from requests.adapters import HTTPAdapter
from requests.packages.urllib3.util.retry import Retry

attempts = 10

retries = Retry(total=attempts,
            backoff_factor=0.1,
            status_forcelist=[ 500, 502, 503, 504 ])

sess = requests.Session()
sess.mount('http://', HTTPAdapter(max_retries=retries ))
sess.mount('https://', HTTPAdapter(max_retries=retries))
sess.get('http://www.google.co.nz/')

关于python - 我们可以使用 urllib 或 urllib2 或 requests 或 mechanize 在 python 中重新加载页面/url 吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45539422/

相关文章:

python-3.x - 如何强制 python 的请求库超时(包括 DNS 查找)

python - 如何为请求库创建嵌套参数

python-2.7 - 将 "data = urllib.parse.urlencode(values) "更改为 python 2.7

python - 两个明显相等的 Python Unicode UTF8 编码字符串不匹配

android - Tensorflow 中的 'Const Op' 是什么?

python - 创建列表

python - 读取 CONNECT header

ssl - 使用 urllib2 连接 sslv3 页面

python - 无法使用 urllib2 从 Web 保存图像

python - 当表格单元格采用混合格式时抓取维基百科信息框