Python 将 UTF-16 和 UTF-8(?) 的混合格式转换为常规字符串

标签 python python-3.x unicode python-unicode

我有这样的字节(来自 requests.get):

<th class=\"app_result_head\">\u0414\u043e\u043b\u0436\u043d\u0438\u043a<\/th>

如何将其转换为正确的 python 字符串?:

<th class="app_result_head">Должник</th>

最佳答案

my_bytes - 有问题的“字节”。事实证明答案相当简单。

out = my_bytes.decode('raw_unicode_escape')
out = out.replace('\"', '"')
out = out.replace('\/', "/")

来自 raw_unicode_escape 的文档:

Latin-1 encoding with \uXXXX and \UXXXXXXXX for other code points.

这正是我所需要的

关于Python 将 UTF-16 和 UTF-8(?) 的混合格式转换为常规字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41549551/

相关文章:

python - Anaconda 的 NumbaPro CUDA 断言错误

python - 使用 curve_fit 拟合数据

python - 信用卡支票练习python

Qt unicode 和元音变音

python - 将python脚本输出输出到文件时出现Unicode错误

python - 并行处理中的迭代

python - 如何访问然后比较 Pandas 数据框中各个单元格的值?

python - 在Python中获取XML属性的值

python - 在列表和字典的列表中搜索值

objective-c - 获取 NSString 的 Unicode 点并将其放入另一个 NSString