python - 单击站点上的 Selenium 返回到类似状态和陈旧错误

标签 python selenium

我正在抓取 this使用 Selenium 的网站。首先,我点击了景点类型旁边的清除按钮。然后我点击了类别列表底部的更多链接。现在对于每个我通过 id 找到元素并单击链接。问题是当我点击第一类户外事件时,网站再次回到初始状态,当我尝试点击下一个链接时出现以下错误:

StaleElementReferenceException: Message: Element is no longer attached to the DOM

我的代码是:

class TripSpider(CrawlSpider):
  name = "tspider"
  allowed_domains = ["tripadvisor.ca"]
  start_urls = ['http://www.tripadvisor.ca/Attractions-g147288-Activities-c42-Dominican_Republic.html']

  def __init__(self):
    self.driver = webdriver.Firefox()
    self.driver.maximize_window()


  def parse(self, response):
    self.driver.get(response.url)
    self.driver.find_element_by_class_name('filter_clear').click()
    time.sleep(3)
    self.driver.find_element_by_class_name('show').click()
    time.sleep(3)
    #to handle popups
    self.driver.switch_to.window(browser.window_handles[-1])
    # Close the new window
    self.driver.close()
    # Switch back to original browser (first window)
    self.driver.switch_to.window(browser.window_handles[0])
    divs = self.driver.find_elements_by_xpath('//div[contains(@id,"ATTR_CATEGORY")]')
    for d in divs:
      d.find_element_by_tag_name('a').click()
      time.sleep(3)

最佳答案

这个网站的问题尤其在于,每次您单击一个元素时,DOM 都会发生变化,因此您无法循环访问过时的元素。

我不久前遇到了同样的问题,我为每个链接使用不同的窗口解决了它。

您可以更改这部分代码:

divs = self.driver.find_elements_by_xpath('//div[contains(@id,"ATTR_CATEGORY")]')
for d in divs:
    d.find_element_by_tag_name('a').click()
    time.sleep(3)

对于:

from selenium.webdriver.common.keys import Keys
mainWindow = self.driver.current_window_handle
divs = self.driver.find_elements_by_xpath('//div[contains(@id,"ATTR_CATEGORY")]')
for d in divs:
    # Open the element in a new Window
    d.find_element_by_tag_name('a').send_keys(Keys.SHIFT + Keys.ENTER)
    self.driver.switch_to_window(self.driver.window_handles[1])

    # Here you do whatever you want in the new window

    # Close the window and continue
    self.driver.find_element_by_tag_name('body').send_keys(Keys.CONTROL + 'w')
    self.driver.switch_to_window(mainWindow)

关于python - 单击站点上的 Selenium 返回到类似状态和陈旧错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33370759/

相关文章:

java - :first/:first-child doesn't seem to work with Selenium 2

Python 的多处理不能很好地与 threading.local 配合使用?

python - HTTP API 的嵌套 GET 参数

javascript - 如何以编程方式单击 "Cancel search"按钮?

java - 如何处理 StaleElementReferenceException

javascript - Protractor :加载配置文件时出错

python - 如何在Python中运行循环并每次返回到不同的列表

python - 虾属性错误: can't set attribute

python - 主窗口的多个垂直工具栏

python - Pycharm 未使用 pytest、pytest bdd 找到测试