python - Unicode编码/解码

标签 python unicode encoding utf-8

我有一个看起来像这样的字符串。

st = '/M\xe4rzen'

我想将其转换为 unicode。我怎样才能做到这一点？我试过:

st.decode('utf-8')
unicode(t, 'utf-8')

原始文件是 utf-8 编码的，但我似乎无法获得字符串的 unicode 表示形式。

最佳答案

您的数据不是 UTF8 编码；它更有可能使用 Latin-1 编码:

>>> print st.decode('latin1')
/Märzen

调用 .decode() 就足够了，不需要也调用 unicode()。

关于python - Unicode编码/解码，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/15637419/

上一篇：python根据另一个列表的顺序根据属性对对象列表进行排序

下一篇：python - 如何在 Tornado 的 POST 处理程序中获取 JSON 参数？

相关文章：

python - Django + InnoDB : random failure of model reading

python - "u"和 "r"字符串前缀究竟是做什么的，什么是原始字符串文字？

c# - 字节数组子串

mysql - Grails 和默认的 mysql 编码

Python:如何互换访问对象或字典？

python - 将数据框中的所有数字除以一个常数

python - 在 pathlib.Path 上模拟 open() 以使用 unittest.mock 返回模拟文件句柄

c - 输出 unicode wchar_t 字符

javascript - 具有 Unicode 字符的 SVG 文本元素

python - 如何将\x22之类的字符转换成字符串？

©2024 IT工具网联系我们