<分区>
好吧,我有一个包含 unicode“û”的文件。然而,如以下测试用例所示,这未被正确读取:
print("û")
with open(r"testfile.txt") as f:
for line in f:
print(line)
哪些输出:
û
û
IDE 可以正确显示该字符 - 但通过读取文件显示另一个字符。
如果我在调试器中执行它,我会看到 f
具有“编码”cp1252。不是 unicode。
那么我该如何“解决”这个问题呢?
在 notepad++ 中打开文件告诉我文件确实是 UTF-8。如果我手动将文件更改为 windows-codepage 1252,它似乎可以工作。但这并不是我真正想要的。