python - 剥离 URL - Python

标签 python regex url strip

好的,我如何使用正则表达式删除 http AND/OR www 只是为了让 http://www.domain.com/ 进入 domain.com

假设 x 是任何类型的 TLD 或 cTLD

输入示例:

http://www.domain.x/

www.domain.x

输出:

域.x

最佳答案

不要使用正则表达式,使用 urlparse 获取 netloc

>>> x = 'http://www.domain.com/'
>>> from urlparse import urlparse
>>> o = urlparse(x)
>>> o
ParseResult(scheme='http', netloc='www.domain.com', path='/', params='', query='', fragment='')
>>> 

然后

>>> o.netloc
'www.domain.com'
>>> if o.netloc.startswith('www.'): print o.netloc[4:]
... 
domain.com
>>> 

关于python - 剥离 URL - Python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11242258/

相关文章:

python - 寻找一种在 Django admin 中显示代码块的简单方法

python - 我应该将目标类转换为浮点型还是整数型?

python - 展平包含元组的元组列表

python - 使用 python pysftp 包,出现 "SSHException: Bad host key from server"错误

regex - 如何仅在 powershell 的子字符串中替换特定字符

Javascript 替换单引号不起作用

regex - 使用正则表达式过滤正则表达式结果时遇到问题

web-services - 如何验证电子邮件地址的顶级域?

asp.net - 如何从我的 URL 中删除 ASP.NET session ID?

php - 通过 URL 将文件上传到我的 Linux PHP 虚拟主机