我正在使用 playwright(Firefox 浏览器)来抓取一些网站。当我向下滚动页面时,许多网站会加载更多内容。问题是 await page.$$("") 方法没有获取加载的新内容。
但是如果我在滚动后在控制台上执行 document.querySelectorAll("") ,那么我也可以获得更新的内容。
我看到 puppeteer 有一个设置 page.setCacheEnabled(enabled) 允许禁用缓存,但我在 playwright 中找不到类似的东西。
最佳答案
你说得很对,剧作家中没有像setCacheEnabled
这样的方法。一种解决方法是为所有请求设置一条路由:
page.route('**', route => route.continue());
您可以看到here那:
Enabling routing disables http cache.
这应该完成同样的事情。
关于javascript - 剧作家禁用网页缓存,以便我可以在向下滚动后获取新元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68522170/