javascript - 收集html文件中使用的所有js、css和img资源

我想编写一个 npm 包来本地化 html url。
1.使用html url下载html页面
2.解析html文件，提取html中使用的所有js、css和img文件并将这些资源本地化。
3.如果这些js、css和img文件使用了一些外部资源，请将这些资源本地化。例如，提取css中的背景图片。

第一个和第二个要求很容易满足。但我对最后一项一无所知。我可以解析所有 css 文件并本地化其中使用的资源。但是我该如何解析js文件呢？
例如: 如果js在html dom中添加了'script src = XXX'标签，我该如何提取src？

最佳答案

我想我会尝试使用 headless 浏览器来捕获每个网络调用，而不是尝试解析代码。

我个人没有使用过它，但是PhantomJS似乎符合要求。

它可用于加载网页，然后执行通常在请求上发生的任何脚本/CSS，并在页面加载后执行内容。

network monitoring features可能是您想要使用的。

关于javascript - 收集html文件中使用的所有js、css和img资源，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38711083/

相关文章：

javascript - 在 ExtJS 菜单项中添加按钮