好的,我如何使用正则表达式删除 http AND/OR www 只是为了让 http://www.domain.com/ 进入 domain.com
假设 x 是任何类型的 TLD 或 cTLD
输入示例:
www.domain.x
输出:
域.x
最佳答案
不要使用正则表达式,使用 urlparse 获取 netloc
>>> x = 'http://www.domain.com/'
>>> from urlparse import urlparse
>>> o = urlparse(x)
>>> o
ParseResult(scheme='http', netloc='www.domain.com', path='/', params='', query='', fragment='')
>>>
然后
>>> o.netloc
'www.domain.com'
>>> if o.netloc.startswith('www.'): print o.netloc[4:]
...
domain.com
>>>
关于python - 剥离 URL - Python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11242258/