python - BeautifulSoup - 嵌套表

标签 python web-scraping beautifulsoup

我首先要指出,我对这一切都很陌生,但在尝试访问嵌套表格单元格时遇到了困难。

这是我试图在第 282 行附近找到的平方英尺字段:查看源:http://services.wakegov.com/realestate/Account.asp?id=0355891

'square_feet': soup.findAll('table')[10].findAll('tr')[15].get_text().strip(),

我收到的错误是:

IndexError: list index out of range

最佳答案

一种更具可读性和简单的方法是依赖参数标签 - 换句话说,通过文本查找元素,获取父 td 元素并查找下一个 td 同级元素,例如:

soup.find(text="Heated Area").find_parent('td').find_next_sibling("td").get_text() 

关于python - BeautifulSoup - 嵌套表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30077908/

相关文章:

python - 澄清/何时/何地在 django/python 中使用 super

python - 从另一个字典列表中减去字典列表中的值

python - Selenium PhantomJS 抛出 EelementNotVisible,而 Firefox 在组合框选择期间完全正常

python - 如何在没有浏览器仿真或 headless 浏览器的情况下从 python 脚本在网页中调用 ajax?

python - 如何使用 BeautifulSoup 从新闻网站检索不同类别

python - 导入错误: cannot import name 'mylist' from 'mymodule'

python - 从记录 ndarray 中选择行范围

python - Beautifulsoup 在抓取 YouTube channel 时返回空列表

python - 从提供者列表中的单个结果中抓取数据

python - 请求异常.InvalidURL : Failed to parse: <Response [200]> in python