我正在编写脚本,想检查 html 中是否存在特定类。
from bs4 import BeautifulSoup
import requests
def makesoup(u):
page=requests.get(u)
html=BeautifulSoup(page.content,"lxml")
return html
html=makesoup('https://www.yelp.com/biz/soco-urban-lofts-dallas')
print("3 star",html.has_attr("i-stars i-stars--large-3 rating-very-large")) #it's returning False
res = html.find('i-stars i-stars--large-3 rating-very-large")) #it's returning NONE
请指导我如何解决这个问题?如果我以某种方式获得 title (title="3.0 star rating") 也对我有用。控制台 HTML 屏幕截图
<div class="i-stars i-stars--large-3 rating-very-large" title="3.0 star rating">
<img class="offscreen" height="303" src="https://s3-media1.fl.yelpcdn.com/assets/srv0/yelp_design_web/8a6fc2d74183/assets/img/stars/stars.png" width="84" alt="3.0 star rating">
</div>
最佳答案
has_attr
是一种检查元素是否具有所需的属性 的方法。 class
是一个属性,i-stars i-stars--large-3 rating-very-large
是它的值。
find
需要 CSS selectors ,而不是类值。因此,您应该改为使用 html.find('div.i-stars.i-stars--large-3.rating-very-large')
。这是因为您正在寻找具有所有这些类的div
。
关于python - 使用 beautifulsoup Python 检查 HTML 中是否存在特定类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40746777/