我正在尝试在 python 脚本中捕获和匹配俄语字符。由于俄语字符不属于 [a-Z] 类型,我应该用什么正则表达式来匹配它们。我不能使用 (.*),因为它会匹配所有内容。
linkpat = re.compile('name=[a-Z]+;size=[0-9]+')
最佳答案
使用 unicode 标志:
re.compile('name=\w+;size=\d+', re.U)
不过,这也可以匹配任何语言的任何字母(加上下划线),而不仅仅是俄语。
关于python - Python 中非英语语言的正则表达式匹配,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4794326/