Python 正则表达式 : Bad character range

我有下一个正则表达式来查找文本上的表情符号:

re.compile(u'([\U00002600-\U000027BF])|([\U0001F300-\U0001F64F])|([\U0001F680-\U0001F6FF])')

它在 Python 3 中运行良好，但在 Python 2.7 中我得到了这个:

sre_constants.error: bad character range

如何修复它以支持 Python 2.7 和 Python 3？

最佳答案

使用 r'(... 而不是 u'(...，如下所示:

re.compile(r'([\U00002600-\U000027BF\U0001F300-\U0001F64F\U0001F680-\U0001F6FF])')

另请注意，您可以在 [...] 内指定多个范围

关于Python 正则表达式 : Bad character range，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/44314290/