我想在使用 scrapy 和 selenium 进行抓取时禁用 JavaScript。 这样做的目的是提高抓取速度。我发现了对 Firefox 驱动程序的偏好,而不是 PhantomJS。
firefox_profile = webdriver.FirefoxProfile()
firefox_profile.set_preference("javascript.enabled", False)
driver = webdriver.Firefox(firefox_profile=firefox_profile)
driver.get('http://www.quora.com/')
如何为 PhantomJS webdriver 完成此操作?
最佳答案
PhantomJS 中的 WebDriver 协议(protocol)是一个纯 JavaScript 实现,称为 Ghostdriver。它大量使用 page.evaluate()
访问 DOM,实际上没有其他方法可以访问 DOM、与页面交互或使用 PhantomJS 做任何有意义的事情。你不应该这样做。
如果您仍然想完成它,这应该可行:
cap = webdriver.DesiredCapabilities.PHANTOMJS
cap["phantomjs.page.settings.javascriptEnabled"] = False
driver = webdriver.PhantomJS(desired_capabilities=cap)
关于javascript - 如何通过 Selenium WebDriver 在 PhantomJS 中禁用 JavaScript,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32115673/