<分区>
同事向我提出了一个有趣的问题,涉及我们目前的运营痛点,我很好奇是否有任何东西(实用程序/库/算法)可以帮助实现自动化。
假设您有一个文字值列表(在我们的例子中,它们是 URL)。我们想要做的是,基于这个列表,提出一个匹配所有这些文字项的正则表达式。
所以,如果我的列表是:
http://www.example.com
http://www.example.com/subdir
http://foo.example.com
最简单的答案是
^(http://www.example.com|http://www.example.com/subdir|http://foo.example.com)$
但是对于大量数据来说这会变得很大,我们有一个长度限制,我们正在努力保持在这个限制之下。
目前我们手动编写正则表达式,但这不能很好地扩展,也不能很好地利用任何人的时间。是否有更自动化的方法来分解源数据以得出与所有源值匹配的长度最佳正则表达式?