regex - 我可以改进此正则表达式检查有效域名吗?

标签 regex dns whois

所以,我一直在研究这个域名正则表达式。到目前为止,它似乎选择了带有 SLD 和 TLD(带有可选的 ccTLD)的域名,但存在重复的 TLD 列表。这可以进一步重构吗?

params[:domain_name].downcase.strip.match(/^[a-z0-9\-]{2,63}
\.((a[cdefgilmnoqrstuwxz]|aero|arpa)|(b[abdefghijmnorstvwyz]|biz)|
(c[acdfghiklmnorsuvxyz]|cat|com|coop)|d[ejkmoz]|(e[ceghrstu]|edu)|f[ijkmor]|
(g[abdefghilmnpqrstuwy]|gov)|h[kmnrtu]|(i[delmnoqrst]|info|int)|
(j[emop]|jobs)|k[eghimnprwyz]|l[abcikrstuvy]|
(m[acdghklmnopqrstuvwxyz]|me|mil|mobi|museum)|(n[acefgilopruz]|name|net)|(om|org)|
(p[aefghklmnrstwy]|pro)|qa|r[eouw]|s[abcdeghijklmnortvyz]|
(t[cdfghjklmnoprtvwz]|travel)|u[agkmsyz]|v[aceginu]|w[fs]|y[etu]|z[amw])
(\.((a[cdefgilmnoqrstuwxz]|aero|arpa)|(b[abdefghijmnorstvwyz]|biz)|
(c[acdfghiklmnorsuvxyz]|cat|com|coop)|d[ejkmoz]|(e[ceghrstu]|edu)|f[ijkmor]|
(g[abdefghilmnpqrstuwy]|gov)|h[kmnrtu]|(i[delmnoqrst]|info|int)|
(j[emop]|jobs)|k[eghimnprwyz]|l[abcikrstuvy]|
m[acdghklmnopqrstuvwxyz]|mil|mobi|museum)|
(n[acefgilopruz]|name|net)|(om|org)|
(p[aefghklmnrstwy]|pro)|qa|r[eouw]|s[abcdeghijklmnortvyz]|
(t[cdfghjklmnoprtvwz]|travel)|u[agkmsyz]|v[aceginu]|w[fs]|y[etu]|z[amw]))?$/)

最佳答案

拜托,拜托,请不要使用像这样的固定且极其复杂的正则表达式来匹配已知域名。

TLD 列表不是静态的,特别是 ICANN 正在寻找新 gTLD 的简化流程。甚至ccTLD 列表有时也会更改!

查看来自 http://publicsuffix.org/ 的列表并编写一些能够下载和解析该列表的代码。

关于regex - 我可以改进此正则表达式检查有效域名吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/399932/

相关文章:

regex - 如何使用 swift 正则表达式捕获 unicode 字符

Azure Kubernetes - 如何确定可用于内部负载均衡器的 DNS 名称?

javascript - 如何通过JS从浏览器中的DNS获取TXT记录

php - 创建 whois 查询的最佳方法是什么?

java - java中类定义的正则表达式

javascript - 在某些条件下为新句子添加空格或句点的正则表达式

regex - 如何创建一个在字符串后包含任何内容的正则表达式

ruby-on-rails-3 - 带有设备的子域路由在heroku上不起作用

Python扭曲的irc : Wait for a whois reply inside privmsg method

dns - 获取 WHOIS 数据库的完整副本