javascript - 使用 Selenium 修改 Javascript Navigator 对象

标签 javascript python selenium web-scraping

我尝试使用 Selenium(使用 geckodriver)访问一个站点,它说我被阻止了,但我可以使用 Firefox 浏览器手动访问它。所以我比较了我的指纹的组件,唯一的区别是当我使用 Selenium 时,在 Navigator 对象中“webdriver”设置为“true”。我尝试运行此代码:

from selenium import webdriver

from selenium.webdriver.firefox.options import Options
firefox_binary = '/usr/bin/firefox'
options = Options()
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
caps = DesiredCapabilities().FIREFOX
# caps["pageLoadStrategy"] = "normal"  #  complete
caps["pageLoadStrategy"] = "eager"  #  interactive
injected_javascript=("Object.defineProperty(navigator, 'webdriver', { value: 'false' })")
driver = webdriver.Firefox(executable_path=r'/home/kkkk/ggecko/geckodriver', firefox_binary=firefox_binary)
driver.get('https://auth.citromail.hu/regisztracio/')

driver.execute_async_script(injected_javascript)

但它刚刚加载了“webdriver”仍设置为“true”的页面,然后返回此消息:

Traceback (most recent call last):
  File "/home/kkkk/driverr.py", line 14, in <module>
    driver.execute_async_script(injected_javascript)
  File "/home/kkkk/.local/lib/python3.5/site-packages/selenium/webdriver/remote/webdriver.py", line 652, in execute_async_script
    'args': converted_args})['value']
  File "/home/kkkk/.local/lib/python3.5/site-packages/selenium/webdriver/remote/webdriver.py", line 314, in execute
    self.error_handler.check_response(response)
  File "/home/kkkk/.local/lib/python3.5/site-packages/selenium/webdriver/remote/errorhandler.py", line 242, in check_response
    raise exception_class(message, screen, stacktrace)
selenium.common.exceptions.TimeoutException: Message: Timed out

我做错了什么还是有其他方法可以做到这一点?

最佳答案

引用这个问题: Selenium webdriver: firefox headless inject javascript to modify browser property

它提供了一条有用的途径。

这是代码:

import os
from selenium import webdriver
options=webdriver.FirefoxOptions()
options.set_headless(True)
driver=webdriver.Firefox(options=options)
# solution found here https://stackoverflow.com/questions/17385779/how-do-i-load-a-javascript-file-into-the-dom-using-selenium
driver.execute_script("var s=window.document.createElement('script'); s.src='javascriptFirefox.js';window.document.head.appendChild(s);")
driver.get('https://auth.citromail.hu/regisztracio/')

Javascript 文件 javascriptFirefox.js

// overwrite the `languages` property to use a custom getter
const setProperty = () => {
    Object.defineProperty(navigator, "languages", {
        get: function() {
            return ["en-US", "en", "es"];
        }
    });

    // Overwrite the `plugins` property to use a custom getter.
    Object.defineProperty(navigator, 'plugins', {
        get: () => [1, 2, 3, 4, 5],
    });

    // Pass the Webdriver test
    Object.defineProperty(navigator, 'webdriver', {
      get: () => false,
    });
    callback();
};
setProperty();

关于javascript - 使用 Selenium 修改 Javascript Navigator 对象,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50573455/

相关文章:

javascript - 是否可以使用 JavaScript 操作嵌入在 HTML 文档中的 SVG 文档?

javascript - 使用 Cesium Js 通过搜索框查找对象

python - 为什么 sys.path 是一个列表?

django - 将Selenium与Pytest结合使用以在Docker中运行的Django 2.2项目

javascript - ionic 菜单中 ionic 幻灯片的实现不起作用

javascript - 梅西 jQuery 确认框重定向

python - 如何在运行时复制 python 模块?

python - Matplotlib latex 部分的垂直间距

selenium - 我可以为 Protractor 设置更长的超时时间以连接到 Selenium 驱动程序吗?

java - selenium Web驱动程序:如何从Selenium Junit程序中调用类