我已经在使用 puppeteer至 刮 但是,我的页面还需要原始 html(基本上是页面源)。
我知道我可以获取原始 html,但也许 puppeteer 将它保存在某个地方。
puppeteer 是否在 goto() 之后保存页面源?
最佳答案
goto
方法返回一个解析为主要资源响应的 promise 。所以你可以做这样的事情:
const response = await page.goto(url);
console.log(await response.text());
但我建议使用
page.content()
方法来获取页面的完整 HTML 内容,包括文档类型。阅读更多关于 content .
关于dart - 使用 puppeteer 获取源 html,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57188311/