python - 使用 Python Selenium 进行抓取 : iterate through html table without tags

我是一名 Python 新手，正在从事一个有趣的小抓取项目。尝试从这里获取信息: http://www.airfleets.net/flottecie/American%20Airlines.htm

我使用 Python 2 并使用 Selenium

页面上有一个包含飞机详细信息的表格。我想迭代该表的第二列，该列标记为“事件”。通常，我会使用 find_element_by_id 选择表。但是，该表没有 id 标记。我认为我需要通过 find_element_by_xpath 查找表，但我不确定查找表以及第二列中的行的路径语法。

总之，如果表没有任何标识标签，如何迭代表的行？

最佳答案

您可以使用 CSS 选择器或 XPath。正如评论中提到的，您的浏览器的开发工具可能有一个内置的方法来执行此操作。

该表的 Xpath 是

/html/body/table[4]/tbody/tr[1]/td/table[2]/tbody/tr/td[2]/table

您可以使用的 CSS 选择器是

body > table:nth-child(6) > tbody > tr:nth-child(1) > td > table:nth-child(3) > tbody > tr > td:nth-child(2) > table

例如，在 Chrome 中，您可以通过以下方式获取此信息:

(1) 打开开发工具并找到该元素。您可以通过右键单击任何元素并单击“检查”来完成此操作

2) 右键单击 DOM 中的元素，然后选择“复制”>(复制选择器/复制 XPath

关于python - 使用 Python Selenium 进行抓取 : iterate through html table without tags，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/40311733/

上一篇：python - python Bokeh 中的反向 Axis

下一篇：python - Dictreader 和正则表达式，索引问题

python - 如何使用Python在Selenium WebDriver中获取用户代理信息

python - 如何使用 Python 每天抓取一次每日新闻？

r - 使用 rvest 抓取 - 当标签不存在时使用 NAs 完成

python - Twython 的 Twitter 限制为 140 个字符

python - Boto S3 生命周期到期

python - 忽略 `for` 语句中的异常

javascript - 如何使用 Protractor 设置错误消息

python - 箭头指向标记边缘，与标记大小无关

Python 多处理没有像预期的那样工作