我想在正则表达式中使用单词边界来匹配一些 unicode 文本。 Unicode 字母在 Python 正则表达式中被检测为单词边界,如下所示:
>>> re.search(r"\by\b","üyü")
<_sre.SRE_Match object at 0x02819E58>
>>> re.search(r"\by\b","ğyğ")
<_sre.SRE_Match object at 0x028250C8>
>>> re.search(r"\by\b","uyu")
>>>
如何使单词边界符号不匹配unicode字母?
最佳答案
使用re.UNICODE :
>>> re.search(r"\by\b","üyü", re.UNICODE)
>>>
关于python - 在 Python 正则表达式的 unicode 文本中使用的字边界,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19375666/