<分区>
我有一个以 Unicode 或 UTF-8(我不知道是哪个)编码的文件。当我在 Python 3.4 中读取文件时,生成的字符串被解释为 ASCII 字符串。如何将它转换为 Unicode 字符串,如 u"text"
?
<分区>
我有一个以 Unicode 或 UTF-8(我不知道是哪个)编码的文件。当我在 Python 3.4 中读取文件时,生成的字符串被解释为 ASCII 字符串。如何将它转换为 Unicode 字符串,如 u"text"
?
最佳答案
术语“Unicode”指的是标准,而不是特定的编码。 由于计算机中的文件是二进制文件,因此存在在二进制文件中对 Unicode 数据进行编码的不同方法。其中之一是“UTF-8”。
可以咨询https://docs.python.org/3/howto/unicode.html
本文档中的示例(在“读取和写入 Unicode 数据”部分中)
with open('unicode.txt', encoding='utf-8') as f:
for line in f:
print(repr(line))
在 python 3 中,与 python2 不同,unicode 字符串常量不使用“u”书写。
关于python - 如何在 Python 中将 Unicode 文件读取为 Unicode 字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35691650/
相关文章:
python - 我在 cmd 中运行 .py 脚本,出现错误 "ModuleNotFoundError"
python - 重新加载模块给出 NameError : name 'reload' is not defined
Java Swing - JTextField/JTextArea 无法粘贴补充的 unicode 字符
python - 无法在 pydev eclipse 控制台中显示 unicode 字符
python - 如果我们知道在先字符,则计算 Python 中的字符出现次数