Python 正则表达式仅匹配字母字符([A-Za-z] 但对于 Unicode)

标签 python regex

我觉得问这个问题很傻,答案肯定就在眼前,但我无法通过更广泛的谷歌搜索立即找到它。

匹配字母字符(非数字)的 Python 正则表达式是什么?我正在寻找与 [A-Za-z] 等效但具有 Unicode 支持的内容。

最佳答案

所以看起来你想要的是 \w 的等价物(它确实支持 Unicode,除非你使用 re.ASCII 标志),但没有数字。 (或者没有下划线,我假设——这也是 \w 的一部分。)

你在这里可以做的是采用“双重否定”的等价物:排除 \W(任何不是单词字符的字符)并排除 \d(数字):

re.findall(r'\b[^\W\d_]+\b', 'Jalape\xf1o Jal99ape\xf1o')
# ['Jalapeño']

如果没有上面的单词边界,这将捕获 ['Jalapeo', 'Jal', 'apeño']

关于Python 正则表达式仅匹配字母字符([A-Za-z] 但对于 Unicode),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48820386/

相关文章:

javascript - 如何使用javascript格式化输入框中的价格值?

python - 将 Python 代码与 MySQL 连接时出现回溯错误

python - 如何调整和塑造子图?

java - 使用正则表达式捕获一组连续数字

python - 如何在python中使用正则表达式?

python - 如何使用正则表达式更改数据记录的顺序并将其放在一个数据框中?

python - 使用批归一化层创建顺序模型会卡住程序

c++ - 在 C++ 中将某种结构化的文本文件读入数组

python - pip METADATA Requires-Dist 中的 `extra` 标志是如何使用的?

javascript - 匹配后面没有特定单词的第二个单词