python - 使用 Python 从 URL 获取子域

标签 python string url

例如地址为:

Address = <a href="http://lol1.domain.com:8888/some/page" rel="noreferrer noopener nofollow">http://lol1.domain.com:8888/some/page</a>

我想将子域保存到一个变量中,这样我就可以这样做;

print SubAddr
>> lol1

最佳答案

包裹tldextract使这项任务变得非常简单,然后如果您需要任何进一步的信息,您可以按照建议使用 urlparse:

>>> import tldextract
>>> tldextract.extract("http://lol1.domain.com:8888/some/page"
ExtractResult(subdomain='lol1', domain='domain', suffix='com')
>>> tldextract.extract("http://sub.lol1.domain.com:8888/some/page"
ExtractResult(subdomain='sub.lol1', domain='domain', suffix='com')
>>> urlparse.urlparse("http://sub.lol1.domain.com:8888/some/page")
ParseResult(scheme='http', netloc='sub.lol1.domain.com:8888', path='/some/page', params='', query='', fragment='')

请注意,tldextract 可以正确处理子域。

关于python - 使用 Python 从 URL 获取子域,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6925825/

相关文章:

python - wxPython 和 XMLRPC 线程化

ruby - 为什么 Matz 选择在 Ruby 中默认设置可变字符串?

java - 在我的测试中遇到 MalformedURLException 但以前从未发生过

python - 有没有好的方法来进行这种类型的挖掘?

python - 当每个标签向文本添加样式时,处理文本小部件中的多个标签吗?

python - 字符串格式化和解析

linux - 如何在 sed 中将方括号内的字母和数字替换为相同的数字和括号外的字母?

JavaScript 外部 HTML 编码 URL 字符串

java - 如何获取 URI 的最后一个路径段

python - 通过python将Mysql数据发送到telegram bot