javascript - 从任何类型的网址中提取域名

标签 javascript regex extract

关于从各种 URL 中提取域名存在很多问题,但没有一个问题涵盖所有子域和后缀(.org、.uk、.com、.org.uk、.whatever 等) .

例如:

http://uselesstext.moretext.DOMAIN.org.uk/

结果: DOMAIN.org.uk

这里的主要问题是,似乎不可能设计一种算法来识别 URL 的哪一部分是相关部分(不使用库),因为可能存在数量不同的子域和后缀。

有什么想法吗? (最好使用 JavaScript)

最佳答案

您在这里寻找的是Public Suffix List 。它是每个域名后缀的列表,可以在其下注册独立管理的域名(例如,comorg.uk 等)。

此列表有许多可用的 Javascript 实现。最常见的两个是 publicsuffixlist.jstld.js .

关于javascript - 从任何类型的网址中提取域名,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38961269/

相关文章:

javascript - 了解类 : Compose a Triangle from extending 3 points?

javascript - 如何通过单击命令将一个 SVG 路径元素变形为另一个?

php - 可选时正则表达式不匹配子表达式

regex - sed - 删除行尾的句点

java - stax - 获取 xml 节点作为字符串

opencv - 如何像 Snapchat 的剪刀工具一样提取边缘?

javascript - 在componentDidCatch之后重定向用户的方法

javascript - Promise.all 似乎并没有等待一切完成

C# 正则表达式替换 url

java - 从 PDF 中提取的图像水平碎片化