我想从网站上抓取文本(“显示 650 个结果”)。
我正在寻找的结果是:
Result : Showing 650 results
以下是Html代码:
<div class="jobs-search-results__count-sort pt3">
<div class="jobs-search-results__count-string results-count-string Sans-15px-black-55% pb0 pl5 pr4">
Showing 650 results
</div>
Python 代码:
response = requests.get(index_url)
soup = BeautifulSoup(response.text, 'html.parser')
text = {}
link = "jobs-search-results__count-string results-count-string Sans-15px-black-55% pb0 pl5 pr4"
for div in soup.find_all('div',attrs={"class" : link}):
text[div.text]
text
到目前为止,我的代码似乎无法正常工作。
最佳答案
您不需要
soup.find_all
如果您仅查找一个元素,soup.find
效果也一样您可以使用
tag.string
/tag.contents
/tag.text
访问内部文本
div = soup.find('div', {"class" : link})
text = div.string
关于python - 网页抓取 - 使用 BeautifulSoup 和 Python 从类(class)中获取文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45449380/