您好,我从 via library 收到文本,当我打印收到的文本时,我看到一些非英语字符为“\u00e7”,必须是“ç”。我想我需要以某种方式对文本进行编码和重新解码,但我对 python 很陌生,如果这是正确的方法,我不会这样做。能否请教下我的方法?
最佳答案
使用 unicode_escape
encoding 解码字符串:
>>> s = r'\u00e7'
>>> print s
\u00e7
>>> print s.decode('unicode-escape')
ç
>>>
如果 sys.stdout.encoding
是 ascii
,打印将引发 UnicodeEncodeError
;在这种情况下,对其进行显式编码:
>>> print s.decode('unicode-escape').encode('utf-8')
ç
关于python - 如何在 python 中使用\u00e7 等 unicode 解码文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21646245/