python - Unicode编码/解码

标签 python unicode encoding utf-8

我有一个看起来像这样的字符串。

st = '/M\xe4rzen'

我想将其转换为 unicode。我怎样才能做到这一点?我试过:

st.decode('utf-8')
unicode(t, 'utf-8')

原始文件是 utf-8 编码的,但我似乎无法获得字符串的 unicode 表示形式。

最佳答案

您的数据不是 UTF8 编码;它更有可能使用 Latin-1 编码:

>>> print st.decode('latin1')
/Märzen

调用 .decode() 就足够了,不需要调用 unicode()

关于python - Unicode编码/解码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15637419/

相关文章:

python - Django + InnoDB : random failure of model reading

python - "u"和 "r"字符串前缀究竟是做什么的,什么是原始字符串文字?

c# - 字节数组子串

mysql - Grails 和默认的 mysql 编码

Python:如何互换访问对象或字典?

python - 将数据框中的所有数字除以一个常数

python - 在 pathlib.Path 上模拟 open() 以使用 unittest.mock 返回模拟文件句柄

c - 输出 unicode wchar_t 字符

javascript - 具有 Unicode 字符的 SVG 文本元素

python - 如何将\x22之类的字符转换成字符串?