python - 这个字符串标准化器 Python 片段有什么问题?

标签 python string encoding normalize

似乎每次我认为我掌握了编码时,我都会发现一些新的东西让我困惑:-)

我正在尝试从 UTF-8 字符串中删除法语口音:

>>> import unicodedata

>>> s = u"éèêàùçÇ"

>>> print(unicodedata.normalize('NFKD', s).encode('ascii','ignore'))

我预计eeeaucC作为输出并得到 AA AaA A1AA在 Ubuntu 9.10 和 iPython 0.10 中使用 Python 2.6.4,所有内容均设置为 unicode。

最佳答案

经过进一步测试,如果你使用Python 3或Python 2.6解释器而不是iPython,它就可以工作。

可能是错误的用户设置或错误。

关于python - 这个字符串标准化器 Python 片段有什么问题?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2347953/

相关文章:

java - 不使用trim()从字符串的开头和结尾删除空格

java - 从列表中获取android中的string[]

unicode - 为什么 Unicode 代码点总是至少用 2 个字节编写?

python - 如何制作当前鼠标指针的位图?

python - 如何在 Django 测试用例中设置 cookie?

python - 蒙戈 : avoid duplicate files in gridfs

python - Python Pandas 中的排列和组合

python - 如何确定周期序列的最小周期

python - 如何在python中添加编码askopenfile

java - 如何更正后查询的更改编码?