python ascii 到 unicode 转换

标签 python unicode

我有一个包含如下数据的文件:

\r\n\tSoci\u00e9t\u00e9 implant\u00e9 dans l'internet recrute des t\u00e9l\u00e9conseillers en b to b pour effectuer de la prise de rendez-vous qualifi\u00e9 pour de la conception de site internet et du r\u00e9f\u00e9rencement google.

如何将其打印为 unicode,如下所示:

Société implanté dans l'internet recrute des téléconseillers en b to b pour effectuer de la prise de rendez-vous qualifié pour de la conception de site internet et du référencement google.

我知道我必须使用一些 unicode 函数,但是什么?

最佳答案

这看起来像一个 python unicode 字符串文字;从 unicode_escape 解码此内容。

演示:

>>> data = "\r\n\tSoci\u00e9t\u00e9 implant\u00e9 dans l'internet recrute des t\u00e9l\u00e9conseillers en b to b pour effectuer de la prise de rendez-vous qualifi\u00e9 pour de la conception de site internet et du r\u00e9f\u00e9rencement google."
>>> data.decode('unicode_escape')
u"\r\n\tSoci\xe9t\xe9 implant\xe9 dans l'internet recrute des t\xe9l\xe9conseillers en b to b pour effectuer de la prise de rendez-vous qualifi\xe9 pour de la conception de site internet et du r\xe9f\xe9rencement google."
>>> print data.decode('unicode_escape')

    Société implanté dans l'internet recrute des téléconseillers en b to b pour effectuer de la prise de rendez-vous qualifié pour de la conception de site internet et du référencement google.

您可以在从文件中读取数据时对其进行解码(使用二进制模式),也可以在 Python 2 中使用 io.open() 或常规 open( ) 在 Python 3 中动态解码数据:

from io import open

with open(filename, 'r', encoding="unicode_escape") as inputfile:
    for line in inputfile:
        print(inputfile)

请注意,JSON 字符串使用相同的转义语法; \uhhhh 表示仅使用 ASCII 字符的 Unicode 代码点。

关于python ascii 到 unicode 转换,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20476400/

相关文章:

python - API FedEx express "INVALID.INPUT.EXCEPTION","message":"Invalid field value in the input"

c# - 将文本转换为 unicode 字符串

cocoa-touch - NSString 中的上标序号后缀

python - 如何将 Unicode 组合到 Python 2 输出中?

python - Numpy 与 Pandas 不一致的结果和缺失值

python - 从 PySpark 中的类别分布中查找值的百分位数

Python 强制 dict 条目为 utf-8

python - Django 存储非 unicode 数据

python - Selenium 和 BeautifulSoup : sharing and pulling session data resources to multiple libraries in python

Python - 如果项目是字符串,则将列表项目转换为 unicode