python - 在 Python 的正则表达式中使用带有 unicode 的字尾标记

标签 python regex unicode right-to-left

以下在空闲时匹配,但在模块文件中的方法中运行时不匹配:

import re
re.search('\\bשלום\\b','שלום עולם',re.UNICODE)

而以下两种情况均匹配:

import re
re.search('שלום','שלום עולם',re.UNICODE)

(请注意,stackoverflow 错误地切换了上面一行中的第一项和第二项,因为这是一种从右到左的语言)

如何使 py 文件中的第一个代码匹配?

更新:我应该为第一段写的是它在空闲时匹配,但在使用 PyDev 的 eclipse 控制台中运行时不匹配。

最佳答案

当我使用 unicode 字符串时似乎对我有用:

# -*- coding: utf-8 -*-

import re
match = re.search(u'\\bשלום\\b', u'שלום עולם', re.U)

查看实际效果:http://codepad.org/xWz5cZj5

关于python - 在 Python 的正则表达式中使用带有 unicode 的字尾标记,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3046528/

相关文章:

python - UTF-8 在 Python 日志记录中,如何?

python - 如何只查看列表中所有列表中的第三个值

SUD 的 Python 要求

c# - 根据文化将日期和时间正则表达式设置为 RegularExpressionValidator

c# - COM 方法、Char 类型和 CharSet

css - 添加@charset "ISO-8859-15"有什么好处;在 css 文件的顶部?

python - 计算 Pandas 中数字和非数字列的每日平均值

python - 识别 python pandas 中的重复对

java - 通过在单词中保留 "-"而在 Java 的其他地方消除它来拆分字符串

java - 正则表达式 Java 错误