我目前使用 mechanize 来读取 gzip 压缩的网页,如下所示:
br = mechanize.Browser()
br.set_handle_gzip(True)
response = br.open(url)
data = response.read()
我想知道如何将 urllib2 提取的 gzip 数据解压缩为 HTML 文本?
req = urllib2.Request(url)
opener = urllib2.build_opener()
response = opener.open(req)
data = response.read()
if response.info()['content-encoding'] == 'gzip':
HOW TO DECOMPRESS DATA TO HTML
最佳答案
试试这个:
import StringIO
data = StringIO.StringIO(data)
import gzip
gzipper = gzip.GzipFile(fileobj=data)
html = gzipper.read()
html
现在应该包含 HTML(打印以查看)。参见 here了解更多信息。
关于python - 将 urllib2 获取的 gzip 数据转换为 HTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1704754/