我需要从页面中剪切所有 css 和 js 链接,现在我使用该正则表达式:
([^ ()]*\.(?:css|js)\b)
它工作正常,但它也剪切了一些链接,例如:
href="stylesheets/{asfas}asf{,,.,sfasfas]F{asfas]fAS/MyFontsWebfontsKit.css
我需要添加到我的正则表达式中以排除无效链接。我想我需要排除像“{},”这样的字符。来自正则表达式匹配器?
我使用 JAVA Pattern/Macther 来编译我的正则表达式。
请不要建议我使用 html 解析器(如 Jsoup 等)。
最佳答案
尝试使用这样的正则表达式:
(?<==)([^ (){},]*?\.(?:css|js)\b)
或者:
(?<=\s)([^ (){},]*?\.(?:css|js)\b)
如果您还想获取 href/src。
关于java - 正则表达式从 html 中剪切 css 和 js 链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31833157/