javascript - 在javascript中使用正则表达式提取域名

我有一个域名列表，例如developer.mozilla.org。我只需要提取域名，例如mozilla.org。我使用了 RegExp，但到目前为止还没有得到正确的结果。不确定我错过了什么。

我编写的这段 JavaScript 并没有准确捕获我想要的部分。

var arr = ["developer.mozilla.org", "cdn.mdn.mozilla.net", "www.google-analytics.com", "www.youtube.com"];
var arrLength = arr.length;
var reg = new RegExp('((\\.[a-zA-Z0-9]+)(\\.[a-zA-Z0-9]+))$');

for (i=0; i< arrLength; i++)
{
    console.log(arr[i].match(reg))
}

最佳答案

如果你像这样编写代码，它就会起作用:

var arr = ["developer.mozilla.org", "cdn.mdn.mozilla.net", "www.google-analytics.com", "www.youtube.com"];
var arrLength = arr.length;
var reg = /[^.]+\.[^.]+$/

for (i=0; i< arrLength; i++)
{
    console.log(arr[i].match(reg)[0])
}

一些解释:

首先，您的正则表达式中存在缺陷，导致错过“google-analytics”条目。我可能建议您像这样编写正则表达式

var reg = /[^.]+\.[^.]+$/

您编写的正则表达式有 2 个捕获组，这解释了您从 console.log 获取的数组

['.mozilla.org', '.mozilla', '.org'] = [matching string, capturedGroup1, capturedGroup2]

您可以通过像这样编写正则表达式来使您的组不被捕获:

var reg = new RegExp('(?:(?:\\.[a-zA-Z0-9]+)(?:\\.[a-zA-Z0-9]+))$');

或者按照@Bergi的建议使用正则表达式

var reg = /(?:(?:\.[a-zA-Z0-9]+)(?:\.[a-zA-Z0-9]+))$/

无论如何，当您使用 match 方法时，您都会得到一个返回数组，而您真正感兴趣的是匹配的字符串，即数组中的第一个元素。通过像这样重写循环体，您将获得预期的结果

console.log((arr[i].match(reg) || [])[0]) // note I'm concerned with string.match returning null here

如果你真的不喜欢数组，你可以使用字符串替换

console.log(arr[i].replace(/^.*\.([^.]+\.[^.]+)$/, '$1'))

关于javascript - 在javascript中使用正则表达式提取域名，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/48846302/

javascript - 在javascript中使用正则表达式提取域名

上一篇：javascript - 代码审查，帮助改进此代码以避免重复

下一篇：javascript - 从for()移到map()-无法绕开它