python - 如何在 python 中使用\u00e7 等 unicode 解码文本?

标签 python python-2.7 unicode utf-8 character-encoding

您好,我从 via library 收到文本,当我打印收到的文本时,我看到一些非英语字符为“\u00e7”,必须是“ç”。我想我需要以某种方式对文本进行编码和重新解码,但我对 python 很陌生,如果这是正确的方法,我不会这样做。能否请教下我的方法?

最佳答案

使用 unicode_escape encoding 解码字符串:

>>> s = r'\u00e7'
>>> print s
\u00e7
>>> print s.decode('unicode-escape')
ç
>>> 

如果 sys.stdout.encodingascii,打印将引发 UnicodeEncodeError;在这种情况下,对其进行显式编码:

>>> print s.decode('unicode-escape').encode('utf-8')
ç

关于python - 如何在 python 中使用\u00e7 等 unicode 解码文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21646245/

相关文章:

python - HDF5 可能的数据损坏或丢失?

python - 在 python 2.7 中处理非英文文本

django - 无法使用 django 的 render_to_string 编码单引号 (')

python - 在 python 中处理国际日期

Python:跳过打开文件的注释行并通过当前行传递文件对象的函数

python - 从 Python 中的字符串中提取字段和值

python - 为非 C 程序员解释的缓冲区和内存 View 对象

python-2.7 - 在 python 中制作带有日期的 bins 列

python - Scipy Fmin Guassian 模型到真实数据

javascript - 将 UTF-8 数据转换为正确的字符串格式