python - utf-8 中的汉字字符

标签 python unicode utf-8

>>> s='未作評級'
>>> s
'\xe6\x9c\xaa\xe4\xbd\x9c\xe8\xa9\x95\xe7\xb4\x9a'
>>> s = unicode(s)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe6 in position 0: ordinal not in range(128)

如何将 未作评级 放入 uniciode 中？

最佳答案

要么从一开始就使用 Unicode 字符串:

>>> s = u'未作評級'

或解码当前编码(似乎是UTF-8)的字符串。然后你得到一个 Unicode 字符串。

>>> s = '未作評級'.decode("utf-8")

关于python - utf-8 中的汉字字符，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/17867297/

上一篇：python - 具有条件的列表中的唯一项

下一篇：python - 在 python 中，MemoryError 和 OverflowError 有什么区别？

相关文章：

python - SQL 请求无法使用 sqlparse 进行正确解析

python - 是否可以在 Dash 中上传 csv 文件并将其存储为 pandas DataFrame？

python 在预期异常后返回到 try block

mysql - Perl DBI、MySQL 中带有 ő 和 ű 字符的 UTF8 字符编码

mysql - 克罗地亚语变音符号，mysql查询问题

python - 如何创建只有一个元素的 Python 集？

java - java webapp和oracle中的日语字符

unicode - 将 UTF-16 视为固定的 16 位编码会带来什么问题？

java - 如何在mysql表中保存货币符号unicode

python - 如何使用 Python 读取 utf-8 编码的文本文件