javascript - 使用 grep 捕获 javascript 链接

标签 javascript linux grep wget

当使用 wget 创建我的网站的静态副本时,有几个元素需要通过 javascript 引入外部资源。脚本的模式应该相当恒定,并且不会动态创建 URL。我需要提取的网址如下所示:

onclick="return ns.homepage.load({e:this, src:'https://mysub.mydomain.tld/somedir/content/123456789.html'})"

我想将这些 URL 的列表输出到本地文件,以便我也可以获取它们。

最佳答案

使用 perl + HTML::TreeBuilder 提取您的辅助代码,然后解析它。

您可能需要做一些正则表达式工作,即这个模块可能只能让您吸收“onclick()”事件 - 但获得其余的应该不会太糟糕。

关于javascript - 使用 grep 捕获 javascript 链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3864172/

相关文章:

linux - CSHTML 未在 mod_mono/mono3.2.5 下呈现

linux - Unix 命令通过根据条件组合 2 个文件来创建新的输出文件

url - 如何从 HTML 文件中获取 URL?

regex - grep egrep 多字符串

javascript - backbone.js 中的 View 和附加表行

javascript createElement 和 setAttribute

javascript - Node.js 用于提供网页并可以访问 Node.js 服务器上的资源

linux - 在bash附加换行符中连接两个字符串变量

shell - 将 grep 的输出存储到带有分隔符的变量

javascript - 剑道 UI 模板 : Invalid Template Error