我看过其他 beautifulsoup 得到相同级别类型的问题。好像我的有点不同。
这是网站http://engine.data.cnzz.com/main.php?s=engine&uv=&st=2014-03-01&et=2014-03-31
我正在努力让那张 table 在右边。请注意表的第一行如何展开为该数据的详细分割。我不要那个数据。我只想要最顶级的数据。您还可以看到其他行也可以展开,但在本例中不是。所以只是循环和跳过 tr[2]
可能行不通。我试过这个:
r = requests.get(page)
r.encoding = 'gb2312'
soup = BeautifulSoup(r.text,'html.parser')
table=soup.find('div', class_='right1').findAll('tr', {"class" : re.compile('list.*')})
但是在其他层级还有更多的嵌套list*
。如何只拿到第一关?
最佳答案
仅通过设置 recursive
argument 将搜索限制为指向 table
元素的子元素错误:
table = soup.find('div', class_='right1').table
rows = table.find_all('tr', {"class" : re.compile('list.*')}, recursive=False)
关于Python beautifulsoup 级别 1 仅文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23270805/