python - 将 unicode 字符串转换为字节字符串

标签 python unicode

我从函数中得到一个字符串,它表示为 u'\xd0\xbc\xd0\xb0\xd1\x80\xd0\xba\xd0\xb0',但是为了处理它我需要它是字节串(如 '\xd0\xbc\xd0\xb0\xd1\x80\xd0\xba\xd0\xb0')。

如何在不更改的情况下转换它?

到目前为止,我最好的猜测是采用 s.encode('unicode_escape'),它将返回 '\\xd0\\xbc\\xd0\\xb0\\xd1\\x80\\xd0\\xba\\xd0\\xb0' 并每 5 个字符处理一次,以便 '\xd0' 成为表示为 '\xd0' 的一个字符。

最佳答案

ISO 8859-1(又名 Latin-1)将前 256 个 Unicode 代码点映射到它们的字节值。

>>> u'\xd0\xbc\xd0\xb0\xd1\x80\xd0\xba\xd0\xb0'.encode('latin-1')
'\xd0\xbc\xd0\xb0\xd1\x80\xd0\xba\xd0\xb0'

关于python - 将 unicode 字符串转换为字节字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11174790/

相关文章:

python - 谷歌安全浏览 API : always getting an error

python - 如何强制 'create_bulkloader_config' 获取最新的架构/数据?

python - 用于在 python 中进行单元测试的局部变量,用于验证测试函数的功能

Python UTF-8 比较

perl - 按名称获取 Unicode 代码点 ("character")

python - Tkinter 和 32 位 Unicode 复制 - 任何修复?

winapi - MultiByteToWideChar 是可重入的还是线程安全的?

用于快速、无缝循环许多短音轨的 Python 音频库

python - TensorFlow 2.0 : Cannot Import tf. keras.utils.conv_utils

linux - 读取带有 unicode 字符的文本文件 - Python3