python - 在 Python 正则表达式的 unicode 文本中使用的字边界

我想在正则表达式中使用单词边界来匹配一些 unicode 文本。 Unicode 字母在 Python 正则表达式中被检测为单词边界，如下所示:

>>> re.search(r"\by\b","üyü")
<_sre.SRE_Match object at 0x02819E58>

>>> re.search(r"\by\b","ğyğ")
<_sre.SRE_Match object at 0x028250C8>

>>> re.search(r"\by\b","uyu")
>>>

如何使单词边界符号不匹配unicode字母？

最佳答案

使用re.UNICODE :

>>> re.search(r"\by\b","üyü", re.UNICODE)
>>>

关于python - 在 Python 正则表达式的 unicode 文本中使用的字边界，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/19375666/

上一篇：python - 我如何在 jinja2 中构建可重用的小部件？

下一篇：python - 如何不在 ipython 笔记本(pandas 数据帧的 html 表)中显示 'NaN'？

相关文章：

java - 希腊字符问题 - 没有 Netbeans

windows - Windows 的每个语言版本的默认代码页

c++ - 如何测试我的软件是否能正确使用 UTF-16？

python - 如何从标准输入读取？

javascript - 谁能告诉我这个对象的 "xauthtoken"的正则表达式？

python - 在 matplotlib 中绘制 (x, y) 坐标列表

r - 为什么 gsubfn 会省略部分匹配项？

c++ - 使用 C++ 正则表达式一次性替换多个正则表达式

python - 使用 Xpath 提取值时 Scrapy 中的空列表

python - 使用 Python 与销售数据进行交叉表

python - 在 Python 正则表达式的 unicode 文本中使用的字边界

上一篇：python - 我如何在 jinja2 中构建可重用的小部件？

下一篇：python - 如何*不*在 ipython 笔记本(pandas 数据帧的 html 表)中显示 'NaN'？

下一篇：python - 如何不在 ipython 笔记本(pandas 数据帧的 html 表)中显示 'NaN'？