javascript - 收集html文件中使用的所有js、css和img资源

标签 javascript html node.js

我想编写一个 npm 包来本地化 html url。
1.使用html url下载html页面
2.解析html文件,提取html中使用的所有js、css和img文件并将这些资源本地化。
3.如果这些js、css和img文件使用了一些外部资源,请将这些资源本地化。例如,提取css中的背景图片。

第一个和第二个要求很容易满足。但我对最后一项一无所知。 我可以解析所有 css 文件并本地化其中使用的资源。但是我该如何解析js文件呢?
例如: 如果js在html dom中添加了'script src = XXX'标签,我该如何提取src?

最佳答案

我想我会尝试使用 headless 浏览器来捕获每个网络调用,而不是尝试解析代码。

我个人没有使用过它,但是PhantomJS似乎符合要求。

它可用于加载网页,然后执行通常在请求上发生的任何脚本/CSS,并在页面加载后执行内容。

network monitoring features可能是您想要使用的。

关于javascript - 收集html文件中使用的所有js、css和img资源,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38711083/

相关文章:

javascript - 在 ExtJS 菜单项中添加按钮

javascript - null 为 null 或不是对象 javascript 错误

javascript - Objective-C – 在可能修改文档内容后获取 UIWebView 动态 size.height

PHP 不返回变量

node.js - Nodejs 应用程序未使用 docker compose 运行

node.js - 在 express 项目中使用 wallaby.js 时避免使用 EADDRINUSE

javascript - 我需要根据 redux 状态用我的通用样式更新文件

javascript - 如何获取多选的自定义属性

jquery - 如何关闭 jquery 日期选择器

node.js - 将 Facebook 登录和地理位置数据插入 MongoDB