python - 在python中读取unicode文件

标签 python file unicode

<分区>

好吧,我有一个包含 unicode“û”的文件。然而,如以下测试用例所示,这未被正确读取:

print("û")
with open(r"testfile.txt") as f:
    for line in f:
        print(line)

哪些输出:

û
û

IDE 可以正确显示该字符 - 但通过读取文件显示另一个字符。 如果我在调试器中执行它,我会看到 f 具有“编码”cp1252。不是 unicode。

那么我该如何“解决”这个问题呢?

在 notepad++ 中打开文件告诉我文件确实是 UTF-8。如果我手动将文件更改为 windows-codepage 1252,它似乎可以工作。但这并不是我真正想要的。

最佳答案

打开文件时可以指定编码:

with open(r"testfile.txt", encoding='utf-8') as f:

关于python - 在python中读取unicode文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46731483/

相关文章:

python - 在 Python 3 中解码二维码

python - 在 Python 中编码 128 位整数?

c - 使用 pthread 和信号打印文本文件

browser - 可以在浏览器中显示的 Unicode 错误符号

python - 使用 Decision_function 时类的顺序是什么

python - 如何在 python 的自定义配置文件中使用 selenium 打开 Google chrome [操作系统 : Ubuntu]

php - 写入一个具有一个函数的文件

java - 从 jar 文件生成 UTF-8 文件

java - Mysql数据库编码问题

regex - Perl:删除除特定字符之外的所有非 ASCII 字符