我是一名 Python 新手,正在从事一个有趣的小抓取项目。尝试从这里获取信息: http://www.airfleets.net/flottecie/American%20Airlines.htm
我使用 Python 2 并使用 Selenium
页面上有一个包含飞机详细信息的表格。我想迭代该表的第二列,该列标记为“事件”。通常,我会使用 find_element_by_id
选择表。但是,该表没有 id
标记。我认为我需要通过 find_element_by_xpath
查找表,但我不确定查找表以及第二列中的行的路径语法。
总之,如果表没有任何标识标签,如何迭代表的行?
最佳答案
您可以使用 CSS 选择器或 XPath。正如评论中提到的,您的浏览器的开发工具可能有一个内置的方法来执行此操作。
该表的 Xpath 是
/html/body/table[4]/tbody/tr[1]/td/table[2]/tbody/tr/td[2]/table
您可以使用的 CSS 选择器是
body > table:nth-child(6) > tbody > tr:nth-child(1) > td > table:nth-child(3) > tbody > tr > td:nth-child(2) > table
例如,在 Chrome 中,您可以通过以下方式获取此信息:
(1) 打开开发工具并找到该元素。您可以通过右键单击任何元素并单击“检查”来完成此操作
关于python - 使用 Python Selenium 进行抓取 : iterate through html table without tags,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40311733/