python - 如何在 Python 中将 Unicode 文件读取为 Unicode 字符串

标签 python python-3.x unicode character-encoding ascii

<分区>

我有一个以 Unicode 或 UTF-8(我不知道是哪个)编码的文件。当我在 Python 3.4 中读取文件时,生成的字符串被解释为 ASCII 字符串。如何将它转换为 Unicode 字符串,如 u"text"

最佳答案

术语“Unicode”指的是标准,而不是特定的编码。 由于计算机中的文件是二进制文件,因此存在在二进制文件中对 Unicode 数据进行编码的不同方法。其中之一是“UTF-8”。

可以咨询https://docs.python.org/3/howto/unicode.html

本文档中的示例(在“读取和写入 Unicode 数据”部分中)

with open('unicode.txt', encoding='utf-8') as f:
  for line in f:
    print(repr(line))

在 python 3 中,与 python2 不同,unicode 字符串常量不使用“u”书写。

关于python - 如何在 Python 中将 Unicode 文件读取为 Unicode 字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35691650/

相关文章:

python - 我在 cmd 中运行 .py 脚本,出现错误 "ModuleNotFoundError"

python - 重新加载模块给出 NameError : name 'reload' is not defined

c# - XML Unicode 安全编码

Java Swing - JTextField/JTextArea 无法粘贴补充的 unicode 字符

python - 无法在 pydev eclipse 控制台中显示 unicode 字符

python - 如果我们知道在先字符,则计算 Python 中的字符出现次数

具有 3 个参数的 Python 的 `range` 函数

python - 使用协程作为装饰器

javascript - Unicode Javascript - 需要向用户显示无效字符

python - Django 。图片字段。 Django中静态文件的路径