我有一个 python 代码,可以从网页(网页抓取)检索一些数据。
它返回以下列表的代码的某些点:
<ul class="nav nav--stacked" id="designer-list">
<li>
<h2>
<a class="text-uppercase bold router-link-active" href="/en-ca/cars_all">
All Cars
</a>
</h2>
</li>
<li>
<a href="/en-ca/cars/c1">
<span>
The car c1
</span>
</a>
</li>
<li>
<a href="/en-ca/cars/c2">
<span>
The car c2
</span>
</a>
</li>
</ul>
我正在使用 BeautifulSoup
,我只想检索每辆车及其名称的引用 (href
)。
在此示例中,我想检索 (/en-ca/cars/c1)=>(汽车 c1) 和 (/en-ca/cars/c2)=>(汽车 c2)。我想跳过第一个元素(所有汽车)。
我可以使用.find_all('li')
并跳过循环内的第一个元素。
我想知道是否有办法通过 BeautifulSoup 方法拒绝元素
最佳答案
你可以这样做,尽管它不是通过 BeautifulSoup 方法
soup = BeautifulSoup(html, "html.parser")
content = soup.find_all('li')[1:]
关于python - 如何使用 BeautifulSoup (python) 跳过 <ul> 的第一个元素?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50530775/