java - 正则表达式从 html 中剪切 css 和 js 链接

标签 java regex

我需要从页面中剪切所有 css 和 js 链接,现在我使用该正则表达式:

([^ ()]*\.(?:css|js)\b)

它工作正常,但它也剪切了一些链接,例如:

href="stylesheets/{asfas}asf{,,.,sfasfas]F{asfas]fAS/MyFontsWebfontsKit.css

我需要添加到我的正则表达式中以排除无效链接。我想我需要排除像“{},”这样的字符。来自正则表达式匹配器?

我使用 JAVA Pattern/Macther 来编译我的正则表达式。

请不要建议我使用 html 解析器(如 Jsoup 等)。

更新1:enter image description here

最佳答案

尝试使用这样的正则表达式:

(?<==)([^ (){},]*?\.(?:css|js)\b)

DEMO

或者:

(?<=\s)([^ (){},]*?\.(?:css|js)\b)

如果您还想获取 href/src。

关于java - 正则表达式从 html 中剪切 css 和 js 链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31833157/

相关文章:

JavaFX - 以编程方式滚动 ScrollPane 的约束

sql - 使用Scala从Spark hadoop中的字符串中提取单词

Java替换正则表达式的所有无效字符

regex - MVC4 Razr 在 AngularJS 电子邮件正则表达式模式上抛出错误

java - 使用正则表达式查找文本中的字符串列表

regex - 如何结合这两种正则表达式模式?

java - 以奇数序列打印奇数

java - 使用 swagger-jaxrs2 和 openapi-configuration.yaml 文件在 Swagger 2.x 中设置 basePath

java - 让 SQLite 在我的 Android 应用程序中运行时遇到问题

java - 如何使用Java创建网络图片