python - Python 中非英语语言的正则表达式匹配

我正在尝试在 python 脚本中捕获和匹配俄语字符。由于俄语字符不属于 [a-Z] 类型，我应该用什么正则表达式来匹配它们。我不能使用 (.*)，因为它会匹配所有内容。

linkpat = re.compile('name=[a-Z]+;size=[0-9]+')

最佳答案

使用 unicode 标志:

re.compile('name=\w+;size=\d+', re.U)

不过，这也可以匹配任何语言的任何字母(加上下划线)，而不仅仅是俄语。

关于python - Python 中非英语语言的正则表达式匹配，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/4794326/

相关文章：

Python 12 天圣诞节