我正在尝试使用以下正则表达式从文本中提取域名,但它什么也没有产生,它有什么问题吗?
我不知道这是否适合问这个“修复代码”问题,也许我应该阅读更多内容。
我只是想节省一些时间。
谢谢。
pat_url = re.compile(r'''
(?:https?://)*
(?:[\w]+[\-\w]+[.])*
(?P<domain>[\w\-]*[\w.](com|net)([.](cn|jp|us))*[/]*)
''')
print re.findall(pat_url,"http://www.google.com/abcde")
我希望输出为 google.com。
最佳答案
不要为此使用正则表达式。请改用 urlparse
标准库。它更直接、更易于阅读/维护。
关于Python - 域名的正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2626995/