Python 正则表达式仅匹配字母字符([A-Za-z] 但对于 Unicode)

我觉得问这个问题很傻，答案肯定就在眼前，但我无法通过更广泛的谷歌搜索立即找到它。

匹配字母字符(非数字)的 Python 正则表达式是什么？我正在寻找与 [A-Za-z] 等效但具有 Unicode 支持的内容。

最佳答案

所以看起来你想要的是 \w 的等价物(它确实支持 Unicode，除非你使用 re.ASCII 标志)，但没有数字。 (或者没有下划线，我假设——这也是 \w 的一部分。)

你在这里可以做的是采用“双重否定”的等价物:排除 \W(任何不是单词字符的字符)并排除 \d(数字):

re.findall(r'\b[^\W\d_]+\b', 'Jalape\xf1o Jal99ape\xf1o')
# ['Jalapeño']

如果没有上面的单词边界，这将捕获 ['Jalapeo', 'Jal', 'apeño']。

关于Python 正则表达式仅匹配字母字符([A-Za-z] 但对于 Unicode)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/48820386/

相关文章：

javascript - 如何使用javascript格式化输入框中的价格值？