python - Python 中非英语语言的正则表达式匹配

标签 python regex unicode python-2.x

我正在尝试在 python 脚本中捕获和匹配俄语字符。由于俄语字符不属于 [a-Z] 类型,我应该用什么正则表达式来匹配它们。我不能使用 (.*),因为它会匹配所有内容。

linkpat = re.compile('name=[a-Z]+;size=[0-9]+')

最佳答案

使用 unicode 标志:

re.compile('name=\w+;size=\d+', re.U)

不过,这也可以匹配任何语言的任何字母(加上下划线),而不仅仅是俄语。

关于python - Python 中非英语语言的正则表达式匹配,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4794326/

相关文章:

Python 12 天圣诞节

python - Python:两个大型numpy数组之间的余弦相似度

python - 检查字典中的非零值

javascript - Javascript 上的正则表达式

java - 如何将模式与完整的字符串匹配?

python - 在谷歌中使用 unicode 从 python 脚本翻译 url

php - 是否可以使用 PHP 检查浏览器的默认字体设置?

java - 在java中将UTF-16 unicode字符转换为UTF-8

python - 交叉编译 gcc 失败 (Python)

SQL Server 使用正则表达式查询?