我正在尝试在每行都有类的页面上抓取表格。有一些类表明该事件尚未发生,我想避免这些。该表与此类似:
<tr class="TRow1 TFuture">
<tr class="TRow2 TFuture">
<tr class="TRow1 TFuture">
<tr class="TRow2 TPresent">
<tr class="TRow1 TPast">
<tr class="TRow2">
我似乎能找到的就是如何选择我想要的类(class)。有没有办法选择除我不想要的类(class)之外的所有内容?
最佳答案
您可以使用 :not
css 选择器:
from bs4 import BeautifulSoup as soup
s = """
<tr class="TRow1 TFuture"></tr>
<tr class="TRow2 TFuture"></tr>
<tr class="TRow1 TFuture"></tr>
<tr class="TRow2 TPresent"></tr>
<tr class="TRow1 TPast"></tr>
<tr class="TRow2"></tr>
"""
tr = soup(s, 'html.parser').select('tr:not(.TFuture)')
输出:
[<tr class="TRow2 TPresent"></tr>, <tr class="TRow1 TPast"></tr>, <tr class="TRow2"></tr>]
关于python - 有没有办法在 BeautifulSoup 中查找不包含特定类的标签?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69639066/