这个问题在这里已经有了答案:
Google Sheets Formula for Extracting Domain From Website?
(1 个回答)
去年关闭。
我一直在使用下面的 excel/google drive 电子表格功能,它允许您获取 url、剥离协议(protocol)(例如 http://)、剥离 www 和剥离 TLD 之后的任何信息。功能是:
=IF(ISERROR(FIND("//www.",A2)), MID(A2,FIND(":",A2,4)+3,FIND("/",A2,9)-FIND(":",A2,4)-3), MID(A2,FIND(":",A2,4)+7,FIND("/",A2,9)-FIND(":",A2,4)-7))
它工作得很好,但如果一个 URL 已经是空的,例如。 示例.com 该函数会引发错误,如果 url 没有尾部斜杠或域名前的斜杠(例如在 http://中),它也会引发错误。我尝试了几种方法来检查 url 是否已经裸露,通过检查单元格是否包含:
http://, https://, ftp://, www. etc..
但这似乎过于复杂和脆弱。有一个更好的方法吗 ?
为了测试,我在这里制作了一个谷歌电子表格:https://docs.google.com/spreadsheets/d/1IVe-VqZtqBtyobBzVHBIm2WQYCvynKZonxK_uEZvXDc/edit#gid=0
最佳答案
您可以在谷歌表格中的单个正则表达式函数中执行此操作:
=REGEXEXTRACT(A1,"^(?:https?:\/\/)?(?:www\.)?([^\/]+)")
或者如果单元格为空白,则使用 iferror:
=IFERROR(REGEXEXTRACT(A1,"^(?:https?:\/\/)?(?:www\.)?([^\/]+)"))
关于excel - 在 excel/google 电子表格中将 url 剥离为基本 url,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37909900/