python - 在python中读取unicode文件

<分区>

好吧，我有一个包含 unicode“û”的文件。然而，如以下测试用例所示，这未被正确读取:

print("û")
with open(r"testfile.txt") as f:
    for line in f:
        print(line)

哪些输出:

û
Ã»

IDE 可以正确显示该字符 - 但通过读取文件显示另一个字符。如果我在调试器中执行它，我会看到 f 具有“编码”cp1252。不是 unicode。

那么我该如何“解决”这个问题呢？

在 notepad++ 中打开文件告诉我文件确实是 UTF-8。如果我手动将文件更改为 windows-codepage 1252，它似乎可以工作。但这并不是我真正想要的。

最佳答案

打开文件时可以指定编码:

with open(r"testfile.txt", encoding='utf-8') as f:

关于python - 在python中读取unicode文件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46731483/

相关文章：

python - 在 Python 3 中解码二维码