web - 从 Google Sheets 中的 URL 字符串中提取根域

标签 web google-sheets spreadsheet

嗨,我正在尝试从 Google 表格中的 URL 字符串中提取根域。我知道如何获取域,并且我有删除 www. 的公式但现在我意识到它不会去除像“mysite”.site.com 这样的子域前缀;哪里mysite没有从域名中剥离。

问题:我如何检索 domain.com rootdomain 域字符串接触字母数字字符,然后是 1 个点,然后是字母数字字符(仅此而已)

到目前为止,Google 表格中的公式:

=REGEXREPLACE(REGEXREPLACE(D3923;"(http(s)?://)?(www\.)?";"");"/.*";"")

也许这可以简化......

测试用例
    https://www.domain.com/ => domain.com
    https://domain.com/ => domain.com
    http://www.domain.nl/ => domain.com
    http://domain.de/ => domain.com
    http://www.domain.co.uk/ => domain.co.uk
    http://domain.co.au/ => domain.co.au
    sub.domain.org/ => sub.domain.com
    sub.domain.org => sub.domain.com
    domain.com => domain.com
    http://www.domain.nl?par=1  => domain.com
    https://www.domain.nl/test/?par=1  => domain.com
    http2://sub2.startpagina.nl/test/?par=1  => domain.com

enter image description here

最佳答案

目前使用:
=trim(REGEXEXTRACT(REGEXREPLACE(REGEXREPLACE(A2;"https?://";"");"^(w{3}\.)?";"")&"/";"([^/?]+)"))
似乎工作正常

更新时间:7-7-2016

(感谢所有的帮助!)

关于web - 从 Google Sheets 中的 URL 字符串中提取根域,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32164108/

相关文章:

date - ColdFusion 电子表格错误,日期或时间字符串无效

vba - 什么是worksheet.Cells(row,col).Formula

Excel VLOOKUP,其中键不在第一列

javascript - 执行函数 appear() 出现在 If 语句中

javascript - 带有三个按钮的弹出窗口

python - 使用 Openai 在 Google 表格中获取完整文章

date - 使用 Arrayformula 或 LOOKUP 填充日历

url - url路径与用斜杠关闭的路径有明显区别吗?

web-applications - 当用户离开页面时如何取消angularjs $timeout

google-apps-script - 我编写了一个脚本将文件复制到备份文件夹,但独立的 webapp 文件被复制到根目录