Python 将 UTF-16 和 UTF-8(?) 的混合格式转换为常规字符串

我有这样的字节(来自 requests.get):

<th class=\"app_result_head\">\u0414\u043e\u043b\u0436\u043d\u0438\u043a<\/th>

如何将其转换为正确的 python 字符串？:

<th class="app_result_head">Должник</th>

最佳答案

my_bytes - 有问题的“字节”。事实证明答案相当简单。

out = my_bytes.decode('raw_unicode_escape')
out = out.replace('\"', '"')
out = out.replace('\/', "/")

来自 raw_unicode_escape 的文档:

Latin-1 encoding with \uXXXX and \UXXXXXXXX for other code points.

这正是我所需要的

关于Python 将 UTF-16 和 UTF-8(?) 的混合格式转换为常规字符串，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41549551/

相关文章：

python - Anaconda 的 NumbaPro CUDA 断言错误