我正在尝试使用 Selenium 网络驱动程序以 headless 模式加载带有 Chrome 浏览器的网站。我在某些特定网站上遇到问题。页面正在加载,在最初的 2-3 秒内它显示一个带有“请启用 javascript...”的页面,3 秒后,页面源变为空白。
我长期使用 Selenium,尤其是 Chrome,我对该平台很熟悉。出于本案例的目的,我在 Mac 操作系统上使用 Chrome 版本 73.0.3683.86 和 ChromeDriver 2.46.628411(根据 Which ChromeDriver version is compatible with which Chrome Browser version? 兼容)。 selenium java 版本是最新的 - 3.141.59
我怀疑 headless Chrome 无法处理特定的内容类型,例如“svg”和任何其他与 GUI 相关的 HTTP 响应。
ChromeOptions chromeOptions = new ChromeOptions();
chromeOptions.addArguments("--headless");
WebDriver driver = new ChromeDriver(chromeOptions);
driver.get("https://identity.tescobank.com/login");
Thread.sleep(3000);
System.out.println(driver.getPageSource());
driver.quit();
预期结果是页面源与在非 headless 模式下显示的相同。
最佳答案
headless Chrome 应该能够处理普通 Chrome 可以做的一切:
It brings all modern web platform features provided by Chromium and the Blink rendering engine to the command line.
(参见 https://developers.google.com/web/updates/2017/04/headless-chrome)
由于只有银行的登录页面给您带来麻烦,我的猜测是该页面的安全检测到异常并决定不为您服务。
他们可以做到这一点的一种方法是查看包含 HeadlessChrome
的用户代理字符串。
也就是说,除非您正在为银行编写集成测试,否则您的行为至少是可疑的。如果您有正当合法的顾虑,请先与银行核实。否则,他们可能会对您采取行动。屏蔽您的 IP 地址(这可能会影响很多人)或要求警方与您交谈。
关于java - Headless Chrome - 获取空白页面源,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55479056/