我一直在寻找一段时间,但我无法找到合适的解决方案。
我有一个包含荷兰语、法语和德语单词的数据库,它们都有自己的特殊字符。例如é
、è
、ß
、ç
等...
对于某些情况,比如在 url 中,我想用字母数字字符替换它们。分别是e
, e
, ss
, c
, etc...
是否有通用函数或 Python 包可以执行此操作?
当然,我可以使用 Regex
来做到这一点,但在这里使用一些通用的东西会更好。
谢谢。
最佳答案
试试这个包:https://pypi.python.org/pypi/Unidecode
>>> import unidecode
>>> unidecode.unidecode(u'çß')
'css'
关于替换特殊字符的Python通用函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34860662/