Python 正则表达式匹配非 ascii 名称

标签 python regex validation unicode non-ascii-characters

我正在尝试使用 re 模块验证名称字段。

\w 不匹配非 ascii 字符,例如 à

似乎在许多其他正则表达式引擎中,解决方案应该是 \p{L},但这在 python 中似乎不受支持。什么是合适的等价物?

更新:

这与围绕该主题的其他问题不同,因为我正在寻找 \w 的 unicode 替代方案,它不是使用默认 re.UNICODE< 获得的 标志(因为此标志还使 \w 匹配数字和下划线)。

最佳答案

我相信您需要使用 UNICODE 修饰符为字符类启用 unicode 支持。

regexRef = re.compile("\w", re.UNICODE)

看看这是否有助于匹配那些非 ASCII 字符。

关于Python 正则表达式匹配非 ascii 名称,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15189649/

相关文章:

Java 模式 - RegEx 不匹配链接搜索

javascript - 如果每个字符都在 0-9 范围内,则去掉所有前导零

jquery - 在 jquery 中组合 keyup、keypress 和 onblur 事件

python - Simpy - 访问多个资源

python - 将文件转换为二进制文件(制作一个 hexdump)

python - "errorMessage": "Unable to import module ' lambda_function'

regex - 计算一个字符串在另一个字符串中出现的次数(Perl)

c# - 正则表达式 (.NET) 以多种格式验证任何实数

validation - grails <元名称 ="layout"... w3c html5 [无效] 标记验证

python - Mac 上的 matplotlib QtDesigner 小部件?