python - utf-8 中的汉字字符

标签 python unicode utf-8

>>> s='未作評級'
>>> s
'\xe6\x9c\xaa\xe4\xbd\x9c\xe8\xa9\x95\xe7\xb4\x9a'
>>> s = unicode(s)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe6 in position 0: ordinal not in range(128)

如何将 未作评级 放入 uniciode 中?

最佳答案

要么从一开始就使用 Unicode 字符串:

>>> s = u'未作評級'

解码当前编码(似乎是UTF-8)的字符串。然后你得到一个 Unicode 字符串。

>>> s = '未作評級'.decode("utf-8")

关于python - utf-8 中的汉字字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17867297/

相关文章:

python - SQL 请求无法使用 sqlparse 进行正确解析

python - 是否可以在 Dash 中上传 csv 文件并将其存储为 pandas DataFrame?

python 在预期异常后返回到 try block

mysql - Perl DBI、MySQL 中带有 ő 和 ű 字符的 UTF8 字符编码

mysql - 克罗地亚语变音符号,mysql查询问题

python - 如何创建只有一个元素的 Python 集?

java - java webapp和oracle中的日语字符

unicode - 将 UTF-16 视为固定的 16 位编码会带来什么问题?

java - 如何在mysql表中保存货币符号unicode

python - 如何使用 Python 读取 utf-8 编码的文本文件