python - 如何使用 BeautifulSoup (python) 跳过 <ul> 的第一个元素?

标签 python beautifulsoup

我有一个 python 代码,可以从网页(网页抓取)检索一些数据。

它返回以下列表的代码的某些点:

<ul class="nav nav--stacked" id="designer-list">
    <li>
        <h2>
            <a class="text-uppercase bold router-link-active" href="/en-ca/cars_all">
                All Cars
            </a>
        </h2>
    </li>
    <li>
        <a href="/en-ca/cars/c1">
            <span>
                The car c1
            </span>
        </a>
    </li>
    <li>
        <a href="/en-ca/cars/c2">
            <span>
                The car c2
            </span>
        </a>
    </li>
</ul>

我正在使用 BeautifulSoup,我只想检索每辆车及其名称的引用 (href)。 在此示例中,我想检索 (/en-ca/cars/c1)=>(汽车 c1) 和 (/en-ca/cars/c2)=>(汽车 c2)。我想跳过第一个元素(所有汽车)。

我可以使用.find_all('li')并跳过循环内的第一个元素。 我想知道是否有办法通过 BeautifulSoup 方法拒绝元素

最佳答案

你可以这样做,尽管它不是通过 BeautifulSoup 方法

soup = BeautifulSoup(html, "html.parser")

content = soup.find_all('li')[1:]

关于python - 如何使用 BeautifulSoup (python) 跳过 <ul> 的第一个元素?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50530775/

相关文章:

python - 如何使用 Django 用数据库中的数据填充 HTML 下拉列表?

python - 美丽汤 : can't get ALL the image src

python - 我一直收到缩进错误,我不应该这样

python - 使用 BS4 抓取未关闭的元标签

python - 如何将 ctypes c_void_p 对象转换为实际类型?

python - 导入错误: No module named enum

Python - 循环 HTML 标签并使用 IF

python - 页面内容根据每个请求而变化

python - 如何在带有 hub.KerasLayer 的 Tensorflow 2.0 中使用自动混合精度

python - 库未加载 : libmkl_intel_lp64. dylib,在 OS X 上使用 Anaconda