<分区>
我通过 mechanize 从一个网站收到以下字符串:
'We\x92ve'
我知道\x92 代表 ’ 字符。我正在尝试将该字符串转换为 Unicode:
>> unicode('We\x92ve','utf-8')
UnicodeDecodeError: 'utf8' codec can't decode byte 0x92 in position 2: unexpected code byte
我做错了什么?
编辑:我尝试“utf-8”的原因是:
>> response = browser.response()
>> response.info()['content-type']
'text/html; charset=utf-8'
现在我发现我不能总是信任 content-type header 。