我觉得问这个问题很傻,答案肯定就在眼前,但我无法通过更广泛的谷歌搜索立即找到它。
匹配字母字符(非数字)的 Python 正则表达式是什么?我正在寻找与 [A-Za-z]
等效但具有 Unicode 支持的内容。
最佳答案
所以看起来你想要的是 \w
的等价物(它确实支持 Unicode,除非你使用 re.ASCII
标志),但没有数字。 (或者没有下划线,我假设——这也是 \w
的一部分。)
你在这里可以做的是采用“双重否定”的等价物:排除 \W
(任何不是单词字符的字符)并排除 \d
(数字):
re.findall(r'\b[^\W\d_]+\b', 'Jalape\xf1o Jal99ape\xf1o')
# ['Jalapeño']
如果没有上面的单词边界,这将捕获 ['Jalapeo', 'Jal', 'apeño']
。
关于Python 正则表达式仅匹配字母字符([A-Za-z] 但对于 Unicode),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48820386/