我想使用 puppeteer 来搜索页面并返回所有可用资源,包括图像、pdf、任何可嵌入的内容等。
出于我们的目的,让我们简单地使用图像进行滚动。 img
标签具有 src
属性,但是通过 CSS 规则加载的图像又如何呢?有没有办法查看加载的资源总数?
最佳答案
一种方法是listen on the event 请求完成
const browser = await puppeteer.launch();
const page = await browser.newPage();
page.on('requestfinished', (request) => {
console.log(request.url())
});
await page.goto('http://www.wildesoft.net/');
await page.waitFor(5000);
await browser.close();
这会将收到的所有资源记录到控制台,例如
关于javascript - 如何使用 puppeteer 查找网页上的所有资源?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49702770/