我想编写一个 npm 包来本地化 html url。
1.使用html url下载html页面
2.解析html文件,提取html中使用的所有js、css和img文件并将这些资源本地化。
3.如果这些js、css和img文件使用了一些外部资源,请将这些资源本地化。例如,提取css中的背景图片。
第一个和第二个要求很容易满足。但我对最后一项一无所知。
我可以解析所有 css 文件并本地化其中使用的资源。但是我该如何解析js文件呢?
例如:
如果js在html dom中添加了'script src = XXX'标签,我该如何提取src?
最佳答案
我想我会尝试使用 headless 浏览器来捕获每个网络调用,而不是尝试解析代码。
我个人没有使用过它,但是PhantomJS似乎符合要求。
它可用于加载网页,然后执行通常在请求上发生的任何脚本/CSS,并在页面加载后执行内容。
network monitoring features可能是您想要使用的。
关于javascript - 收集html文件中使用的所有js、css和img资源,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38711083/