我有这样一个正则表达式:
re.compile(r"((https?):((//)|(\\\\))+[\w\d:#@%/;$()~_?\+-=\\\.&]*)", re.MULTILINE|re.UNICODE)
但这不包括 hashbangs (#!)
。我需要更改什么才能使其正常工作?我知道我可以将 !
添加到带有 #@%
等的组中,但这会选择类似
Check this out: http://example.com/something/!!!
我想避免这种情况。
最佳答案
不要尝试为匹配 URL 创建自己的正则表达式。使用已经解决此类问题的其他人,例如 this one .
关于再次使用 Python 正则表达式 - 匹配 URL,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6718633/