我正在尝试使用 re 模块验证名称字段。
\w
不匹配非 ascii 字符,例如 à
。
似乎在许多其他正则表达式引擎中,解决方案应该是 \p{L}
,但这在 python 中似乎不受支持。什么是合适的等价物?
更新:
这与围绕该主题的其他问题不同,因为我正在寻找 \w
的 unicode 替代方案,它不是使用默认 re.UNICODE< 获得的
标志(因为此标志还使 \w
匹配数字和下划线)。
最佳答案
我相信您需要使用 UNICODE 修饰符为字符类启用 unicode 支持。
regexRef = re.compile("\w", re.UNICODE)
看看这是否有助于匹配那些非 ASCII 字符。
关于Python 正则表达式匹配非 ascii 名称,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15189649/