我正在尝试用单个标记替换大量文档中的所有 URL,但是我正在执行的正则表达式似乎不起作用
s/www\.[a-z|0-9]*[.a-z]*/urltoken/g
这将匹配 www.example.com 或 www.example.com.co。但是,如果在那之后还有另一种字符或单词的组合,例如 www.foo.bar?q=lol 或 www.regexr.com/index.html?q=bar。我想在验证 url 的第一部分后适合任何字符组合,即 www.example.com.co_(Here goes those characters)_,但是在遇到单个空格之前。什么样的正则表达式适合 sed?
最佳答案
sed 's/www\.[^ ]*/urltoken/g' 文件
关于regex - 如何使用 sed 匹配任意 URL?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25167797/