嗨,我正在尝试从 Google 表格中的 URL 字符串中提取根域。我知道如何获取域,并且我有删除 www.
的公式但现在我意识到它不会去除像“mysite”.site.com 这样的子域前缀;哪里mysite
没有从域名中剥离。
问题:我如何检索 domain.com
rootdomain 域字符串接触字母数字字符,然后是 1 个点,然后是字母数字字符(仅此而已)
到目前为止,Google 表格中的公式:
=REGEXREPLACE(REGEXREPLACE(D3923;"(http(s)?://)?(www\.)?";"");"/.*";"")
也许这可以简化......
测试用例
https://www.domain.com/ => domain.com
https://domain.com/ => domain.com
http://www.domain.nl/ => domain.com
http://domain.de/ => domain.com
http://www.domain.co.uk/ => domain.co.uk
http://domain.co.au/ => domain.co.au
sub.domain.org/ => sub.domain.com
sub.domain.org => sub.domain.com
domain.com => domain.com
http://www.domain.nl?par=1 => domain.com
https://www.domain.nl/test/?par=1 => domain.com
http2://sub2.startpagina.nl/test/?par=1 => domain.com
最佳答案
目前使用:=trim(REGEXEXTRACT(REGEXREPLACE(REGEXREPLACE(A2;"https?://";"");"^(w{3}\.)?";"")&"/";"([^/?]+)"))
似乎工作正常
更新时间:7-7-2016
(感谢所有的帮助!)
关于web - 从 Google Sheets 中的 URL 字符串中提取根域,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32164108/