python - 为什么 Python 不能识别我的 utf-8 编码源文件?

标签 python python-3.x unicode encoding utf-8

这是一个带有非 ASCII 字符的小 tmp.py:

if __name__ == "__main__":
    s = 'ß'
    print(s)

运行它我得到以下错误:

Traceback (most recent call last):
  File ".\tmp.py", line 3, in <module>
    print(s)
  File "C:\Python32\lib\encodings\cp866.py", line 19, in encode
    return codecs.charmap_encode(input,self.errors,encoding_map)[0]
UnicodeEncodeError: 'charmap' codec can't encode character '\xdf' in position 0: character maps to <undefined>

Python 文档 says :

By default, Python source files are treated as encoded in UTF-8...

我检查编码的方法是使用 Firefox(也许有人会提出更明显的建议)。我在 Firefox 中打开 tmp.py ,如果我选择 View->Character Encoding->Unicode (UTF-8) 它看起来没问题,这就是它在这个问题上面的样子(wth ß 符号)。

如果我说:

# -*- encoding: utf-8 -*-

作为 tmp.py 中的第一个字符串,它不会改变任何东西——错误仍然存​​在。

谁能帮我弄清楚我做错了什么?

最佳答案

您的 terminal is using 的编码不支持该字符:

>>> '\xdf'.encode('cp866')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/opt/local/Library/Frameworks/Python.framework/Versions/3.3/lib/python3.3/encodings/cp866.py", line 12, in encode
    return codecs.charmap_encode(input,errors,encoding_map)
UnicodeEncodeError: 'charmap' codec can't encode character '\xdf' in position 0: character maps to <undefined>

Python 处理得很好,是你的输出编码不能处理它。

您可以尝试在 Windows 控制台中使用 chcp 65001 来切换您的代码页; chcp 是用于更改代码页的 Windows 命令行命令。

我的,在 OS X(使用 UTF-8)上可以处理得很好:

>>> print('\xdf')
ß

关于python - 为什么 Python 不能识别我的 utf-8 编码源文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14284269/

相关文章:

python - 我在哪里可以找到所有窗口管理器协议(protocol)原子的列表?

python - 如何将列表中的相应元素分别添加到python字典键和值中

python - 替换 block 大小小于阈值的重复项 - Python

c++ - C/C++ Unicode 字符编码大小和默认格式

ios - 将 Unicode 连字符减号插入字符串会导致错误

python - Scrapy - 通过动态添加 allowed_urls 来克服 start_uri 重定向 - parse_start_url 问题

python - 使用python从网站中提取数据

python - 贝叶斯优化应用于 CatBoost

delphi - 从 Delphi 字符串中检测和检索代码点和代理项

python - 构建 Python 3.7.1 - SSL 模块失败