python - 使用 Python Selenium 进行抓取 : iterate through html table without tags

标签 python selenium web-scraping

我是一名 Python 新手,正在从事一个有趣的小抓取项目。尝试从这里获取信息: http://www.airfleets.net/flottecie/American%20Airlines.htm

我使用 Python 2 并使用 Selenium

页面上有一个包含飞机详细信息的表格。我想迭代该表的第二列,该列标记为“事件”。通常,我会使用 find_element_by_id 选择表。但是,该表没有 id 标记。我认为我需要通过 find_element_by_xpath 查找表,但我不确定查找表以及第二列中的行的路径语法。

总之,如果表没有任何标识标签,如何迭代表的行?

最佳答案

您可以使用 CSS 选择器或 XPath。正如评论中提到的,您的浏览器的开发工具可能有一个内置的方法来执行此操作。

该表的 Xpath 是

/html/body/table[4]/tbody/tr[1]/td/table[2]/tbody/tr/td[2]/table 

您可以使用的 CSS 选择器是

body > table:nth-child(6) > tbody > tr:nth-child(1) > td > table:nth-child(3) > tbody > tr > td:nth-child(2) > table

例如,在 Chrome 中,您可以通过以下方式获取此信息:

(1) 打开开发工具并找到该元素。您可以通过右键单击任何元素并单击“检查”来完成此操作

enter image description here

2) 右键单击​​ DOM 中的元素,然后选择“复制”>(复制选择器/复制 XPath enter image description here

关于python - 使用 Python Selenium 进行抓取 : iterate through html table without tags,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40311733/

相关文章:

java - 如何在新系统上使用 Java 安装 Selenium 并使用 Jenkins 作为 CI 生成正确的测试报告

python - 如何使用Python在Selenium WebDriver中获取用户代理信息

python - 如何使用 Python 每天抓取一次每日新闻?

r - 使用 rvest 抓取 - 当标签不存在时使用 NAs 完成

python - Twython 的 Twitter 限制为 140 个字符

python - Boto S3 生命周期到期

python - 忽略 `for` 语句中的异常

javascript - 如何使用 Protractor 设置错误消息

python - 箭头指向标记边缘,与标记大小无关

Python 多处理没有像预期的那样工作