如何获取给定代码中 "Subforum"
类下所有标签的 href?
<li class="subforum">
<a href="Link1">Link1 Text</a>
</li>
<li class="subforum">
<a href="Link2">Link2 Text</a>
</li>
<li class="subforum">
<a href="Link3">Link3 Text</a>
</li>
我试过这段代码,但显然它没有用。
Bs = BeautifulSoup(requests.get(url).text,"lxml")
Class = Bs.findAll('li', {'class': 'subforum"'})
for Sub in Class:
print(Link.get('href'))
最佳答案
href
属于a
标签,不属于li
标签,使用li.a
获取一个
标签
import bs4
html = '''<li class="subforum">
<a href="Link1">Link1 Text</a>
</li>
<li class="subforum">
<a href="Link2">Link2 Text</a>
</li>
<li class="subforum">
<a href="Link3">Link3 Text</a>
</li>`<br>'''
soup = bs4.BeautifulSoup(html, 'lxml')
for li in soup.find_all(class_="subforum"):
print(li.a.get('href'))
输出:
Link1
Link2
Link3
为什么要使用class_
:
搜索具有特定 CSS 类的标签非常有用,但是 CSS 属性的名称 class
是 Python 中的保留字。 使用class 作为关键字参数会给你一个语法错误。从 Beautiful Soup 4.1.2 开始,你可以使用关键字参数 class_
按 CSS class 搜索。
关于python - 获取 <li> 中 <a> 标签的 href,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41745514/