似乎每次我认为我掌握了编码时,我都会发现一些新的东西让我困惑:-)
我正在尝试从 UTF-8 字符串中删除法语口音:
>>> import unicodedata
>>> s = u"éèêàùçÇ"
>>> print(unicodedata.normalize('NFKD', s).encode('ascii','ignore'))
我预计eeeaucC
作为输出并得到 AA AaA A1AA
在 Ubuntu 9.10 和 iPython 0.10 中使用 Python 2.6.4,所有内容均设置为 unicode。
最佳答案
经过进一步测试,如果你使用Python 3或Python 2.6解释器而不是iPython,它就可以工作。
可能是错误的用户设置或错误。
关于python - 这个字符串标准化器 Python 片段有什么问题?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2347953/