python - 在 Python 正则表达式的 unicode 文本中使用的字边界

标签 python regex unicode

我想在正则表达式中使用单词边界来匹配一些 unicode 文本。 Unicode 字母在 Python 正则表达式中被检测为单词边界,如下所示:

>>> re.search(r"\by\b","üyü")
<_sre.SRE_Match object at 0x02819E58>

>>> re.search(r"\by\b","ğyğ")
<_sre.SRE_Match object at 0x028250C8>

>>> re.search(r"\by\b","uyu")
>>>

如何使单词边界符号不匹配unicode字母?

最佳答案

使用re.UNICODE :

>>> re.search(r"\by\b","üyü", re.UNICODE)
>>> 

关于python - 在 Python 正则表达式的 unicode 文本中使用的字边界,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19375666/

相关文章:

java - 希腊字符问题 - 没有 Netbeans

windows - Windows 的每个语言版本的默认代码页

c++ - 如何测试我的软件是否能正确使用 UTF-16?

python - 如何从标准输入读取?

javascript - 谁能告诉我这个对象的 "xauthtoken"的正则表达式?

python - 在 matplotlib 中绘制 (x, y) 坐标列表

r - 为什么 gsubfn 会省略部分匹配项?

c++ - 使用 C++ 正则表达式一次性替换多个正则表达式

python - 使用 Xpath 提取值时 Scrapy 中的空列表

python - 使用 Python 与销售数据进行交叉表