python - 如何从 unicode 文字创建 unicode 实例

标签 python python-2.7 unicode encoding unicode-literals

由于 C 扩展中的一些错误,我正在使用 str 实例获取 unicode 数据,或者换句话说,str 根本没有编码,并且是 unicode 文字。

例如,这是一个有效的 unicode 文字

>>> u'\xa1Se educado!'

UTF-8 编码的 str 为:

>>> '\xc2\xa1Se educado!'

但是,我得到了一个带有 unicode 文字的 str:

>>> '\xa1Se educado!'

我需要从中创建一个 unicode 实例。使用 unicode() 不起作用,因为它需要编码。我认为 ''.join(unichr(ord(x)) for x in s) 可以满足我的需要,但它真的很难看。必须有更好的解决方案。有什么想法吗?

最佳答案

正如我所怀疑的,必须有一种方法可以使用 python 用于 unicode 的任何“编码”对其进行解码,这就是 raw_unicode_escape

>>> unicode('\xa1Se educado!', 'raw_unicode_escape')
u'\xa1Se educado!'

关于python - 如何从 unicode 文字创建 unicode 实例,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23666653/

相关文章:

python - 如何在 python 3 中生成希伯来语字符串?

winapi - 为什么这个函数有 Unicode 和 ANSI 两种版本?

python - login() 缺少 1 个必需的位置参数 : 'user'

python - python中有没有一种方法可以从两个列表中创建一个新列表,其中第一个列表值用于组成新列表的列表?

python - 解析安全矩阵电子表格 - NoneType 不可迭代

python - 如何在 Mechanize 测试中允许 JSON 响应?

用于 max-sum-max 多个列表的 Pythonic 方法

php - preg_replace 为 unicode

python - 索引数组

python - 如何将包含月份名称的字符串转换为整数?