python - 匹配某事物的第三个实例的正则表达式? (Python)

标签 python regex

我正在尝试创建一个正则表达式来匹配 url 中的第三个/实例,即只记录网站名称本身,没有其他内容。

所以 http://www.stackoverflow.com/questions/answers/help/通过正则表达式后将是 http://www.stackoverflow.com

我自己一直在研究它们并得出:

base_url = re.sub(r'[/].*', r'', url)

但所有这些所做的只是减少指向 http: 的链接 - 所以很明显我需要匹配/的第三个实例 - 谁能解释我将如何做到这一点?

谢谢!

最佳答案

我建议你使用 urlparse用于解析 URL:

In [1]: from urlparse import urlparse

In [2]: urlparse('http://www.stackoverflow.com/questions/answers/help/').netloc
Out[2]: 'www.stackoverflow.com'

.netloc 包括端口号(如果存在)(例如 www.stackoverflow.com:80);如果您不需要端口号,请改用 .hostname

关于python - 匹配某事物的第三个实例的正则表达式? (Python),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7432908/

相关文章:

r - 在特定模式之前子集字符串的一部分

regex - 正则表达式 - 检查逗号分隔的子字符串长度

Python:用字典替换命名组

regex - 为什么选择 ^ 和 $ 来表示正则表达式中的行首和行尾?

python - 如何从数据库创建具有空值的 numpy 二维数组

python - 协程上的 itertools.tee?

mysql - SQL 如果单元格中至少有两个定义的值,则替换该单元格中的值

php - Python 获取 Index Position 比 PHP 慢

python - 如何在Python中使用Openpyxl对多行Excel行进行平均?

python - 索引错误: List index out of range - Python CSV