我正在尝试创建一个正则表达式来匹配 url 中的第三个/实例,即只记录网站名称本身,没有其他内容。
所以 http://www.stackoverflow.com/questions/answers/help/通过正则表达式后将是 http://www.stackoverflow.com
我自己一直在研究它们并得出:
base_url = re.sub(r'[/].*', r'', url)
但所有这些所做的只是减少指向 http: 的链接 - 所以很明显我需要匹配/的第三个实例 - 谁能解释我将如何做到这一点?
谢谢!
最佳答案
我建议你使用 urlparse
用于解析 URL:
In [1]: from urlparse import urlparse
In [2]: urlparse('http://www.stackoverflow.com/questions/answers/help/').netloc
Out[2]: 'www.stackoverflow.com'
.netloc
包括端口号(如果存在)(例如 www.stackoverflow.com:80
);如果您不需要端口号,请改用 .hostname
。
关于python - 匹配某事物的第三个实例的正则表达式? (Python),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7432908/