我正在寻找一种使用 Ruby 从 URL 列表中提取 LinkedIn 个人资料页面的方法。目前我正在遍历 URL 并将它们与这个正则表达式匹配:
/^http:\/\/.+\.linkedin.com\/(pub|in)/
但是,LinkedIn 个人资料目录页面的 URL 如下:
http://www.linkedin.com/pub/dir
,所以我希望避免任何包含 pub/dir 路径的链接。我知道可以否定 Ruby 正则表达式中的字符类,例如 [^abc] 匹配任何不是 abc 的字符。有没有办法对字符串做同样的事情? IE。匹配除“dir”之外的任何字符序列?
最佳答案
您可以使用否定前瞻。有点像
(pub(?!\/dir)|in)
关于ruby - 在 Ruby 正则表达式中否定字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6491951/