我有一个看起来像这样的字符串。
st = '/M\xe4rzen'
我想将其转换为 unicode。我怎样才能做到这一点?我试过:
st.decode('utf-8')
unicode(t, 'utf-8')
原始文件是 utf-8 编码的,但我似乎无法获得字符串的 unicode 表示形式。
最佳答案
您的数据不是 UTF8 编码;它更有可能使用 Latin-1 编码:
>>> print st.decode('latin1')
/Märzen
调用 .decode()
就足够了,不需要也调用 unicode()
。
关于python - Unicode编码/解码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15637419/